19 février 2009
Soutenance de thèse Gabriele Musillo
M. Gabriele Musillo soutiendra, en vue de l'obtention du grade de docteur ès science, mention informatique, sa thèse intitulée
Latent Variable Transforms for Dependency Parsing
Jury:
- Dr. Paola Merlo, Genève, co-directrice
- Prof. Christian Pellegrini, Genève, co-directeur
- Prof. Michael Collins, MIT
- Dr. James Henderson, Genève
- Prof. Giorgio Satta, Padua
- Prof. Eric Wehrli, Genève
Abstract :
This dissertation investigates transforms of dependency grammars into unlexicalised context-free grammars annotated with hidden symbols. Context-free grammars resulting from such transforms are able to efficiently capture bilexical as well as trilexical dependencies. Our transforms make learning and decoding algorithms for probabilistic context-free grammars available to dependency grammars. We design two classes of latent variable transforms. Both classes are designed to induce hidden lexical dependencies that mediate between the head words and their dependents. Our best latent model, that imposes linguistically motivated constraints on the flow of latent information achieves an accuracy of 88% on the Penn Treebank data set. This represents state-of-the-art parsing accuracy with respect to previously proposed unlexicalised models of dependency parsing. Such performance shows that our compact latent variable unlexicalised models induce hidden classes of lexical dependencies that are relevant to parsing accuracy and suggests that we should reassess the relevance of massive lexicalisation to dependency parsing.
Résumé :
Cette these definit des transformations qui reduisent les grammaires de dependance a des grammaires context-free annotees avec des categories latentes. Les grammaires resultant de ces transformations sont capables de capturer efficacement des dependances bilexicales et trilexicales. Ces transformations permettent de transferer les algorithmes de decodage et d'induction de grammaires context-free aux grammaires de dependance. Deux classes de grammaires decorees au moyen de categories latentes sont presentees. Chacune de ces classes est concue pour induire automatiquement des dependences cachees qui encodent les relations qu'un mot gouverneur peut entretenir avec des mots dependants. La meilleure de ces classes de modeles latents, qui impose des contraintes linguistiques sur le flot d'informations cachees, obtient une precision de 88% sur des donnees test standard. Cette performance represente l'etat de l'art par rapport aux modeles de dependence non-lexicalises precedemment proposes. Ceci montre la pertinence des informations latentes capturees par nos modeles et suggere que la necessite d'un usage massif de statistiques lexicales doit etre revisitee.
Date: Jeudi 25 février 2010 à 14h00
Lieu: Site de Battelle (bât. A, salle 404-407, 3ème étage) 7 route de Drize - 1227 Carouge
Performance and Quality Management in Customer Services: metrics, tools and challenge
Rebooting public administration
Soutenance de thèse Taras Holotyak
Opening Public Registers' Data
Ontological Analysis of Organization Modeling Languages
Lancement Think Data
Soutenance de thèse Kae Tsunematsu
Soutenance de Master Abdelaziz Moez Guedri
ISAAM - an evaluation model to holistically assess the information security posture & PwC Global Information Security Survey
From manufacturing to a Globally integrated enterprise
Soutenance de thèse Steve Hostettler
Deciphering Maya Writing
Healthcare is broken, SOS: Service Our Seniors
World Usability Day
Soutenance de thèse Mohammad Soleymani
Wearable Computing for Behavioral Change in Chronic Disease Management
Vision and plans for coming of smart society
Fit in IT au collège Emilie Gourd
L'avenir des sciences de l'information
SAPERE
Energy Informatics for Smart Oil Field and Smart Grid
Expérience CVML
Conférence Florence Devouard
Soutenance de Master Renaud Sauvain
Présentation Kai Lampka
Master Seminar ISS 3
Soutenance de thèse Eniko Szekely
L'avenir du Web
Master Seminar ISS 2
Soutenance de thèse Kaveh Bazargan Harandi
Soutenance de thèse Zerrin Kasap
Master Seminar ISS
Soutenance de thèse Donn Morrison
Soutenance de thèse Andrea Parmigiani
Soutenance de Master Thierno Hamidou Balde
Poste de secrétaire à 50%
Soutenance de thèse Mustafa Kasap
Soutenance de thèse Jérôme Schmid
Boursière d'Excellence UNIGE
Soutenance de Master Jody Hausmann
Soutenance de thèse Jana Kludas
Départ Christian Pellegrini
Science des services: nouvelles opportunités, nouvelles sources de valeur!
Revenu Universel: et s'il rimait avec avenir?
Présidence SARIT
IBM Faculty Award
Mobile Patient Monitoring: From Research to Business
Soutenance de thèse Ugo Bonanni
Cartographie de l'Afrique
Stage en entreprise
Green Internet Routers
Model-Based Design for Modern Computer Games
Soutenance de thèse Matteo Risoldi
Cloud computing: hot or not?
Exploiting Weak Supervision in NLP tasks: Application to Sentiment Summarization
From similarity to scalability in content-based image and video retrieval
2 postes chercheurs PhD
Two talks on machine learning and natural language processing
Soutenance de thèse Gabriele Musillo
Soutenance de thèse Caecilia Charbonnier
Visual Computing Techniques in Inter- and Intra-Class 3D Object Retrieval
The Future of Web Search
