des centaines d'astuces pour vous faciliter le quotidien

Un moteur de recherche d'articles de journal de Genève,la Gazette de Lausanne et du nouveau Quotidien

Un moteur de recherche d'articles de journal de Genève,la Gazette de Lausanne et du nouveau Quotidien

 

08/04/2013

 

Frédéric Kaplan, directeur du Laboratoire d’humanités digitales de

l’EPFL, explique les buts de la nouvelle collaboration établie avec Le

Temps. Il s’agit de créer un moteur de recherche permettant de

fouiller de manière pertinente les archives du Journal de Genève, de

la Gazette de Lausanne et du Nouveau Quotidien

 

 

 

Créer un outil permettant de fouiller un corpus de quatre millions d’articles de

presse grâce à une indexation sémantique. Tel est le but de la collaboration entre

le Laboratoire d’humanités digitales

 de l’Ecole polytechnique fédérale de Lausanne et Le Temps. Leur association va

permettre la mise en place d’un moteur de recherche susceptible d’explorer

d’une nouvelle manière, avec des pertinences inédites, les informations

contenues dans les archives du Journal de Genève , de laGazette de Lausanne et

du Nouveau Quotidien.

 

 

Le Temps: En quoi ces archives sont-elles un bon matériau?

 

Frédéric Kaplan: Elles conservent des informations sur la grande et la petite histoire,

celles des grands moments qui ont marqué les deux derniers siècles, mais aussi une

multitude de plus petits événements oubliés. Selon les époques, les archives de presse

contiennent aussi des informations précises qui, quotidiennement, documentent la

météo, la hauteur du lac, les cours de la bourse ou les horaires de trains. Celles-ci ont

également le grand intérêt d’être déjà numérisées, transcrites et indexées lexicalement,

ce qui nous permet de passer directement à l’étape de l’indexation sémantique. A titre de

comparaison, pour la «Venice Time Machine», ce projet que nous menons pour

reconstruire le passé de Venise à partir de ses archives,nous devons partir de zéro, c’est-

à-dire numériser, transcrire et indexer avant de pouvoir procéder à l’extraction

sémantique.

 

– Quel est le principe de cette forme d’indexation?

 

– Il s’agit de transformer un ensemble de textes en un système d’information.

L’indexation sémantique consiste à extraire automatiquement des informations non

ambiguës, contenues dans les textes des articles. Il s’agit, par exemple, de repérer

toutes les «entités nommées», comme les noms de personnes et de lieux, puis de

reconstruire les réseaux qui lient ces entités et les événements auxquels elles

participent. Grâce aux informations des archives, nous pouvons ainsi tenter de

reconstituer certains éléments biographiques et le réseau social d’un grand nombre de

personnes, tout en sachant que les informations contenues dans les articles sont, en

partie, incertaines et parfois erronées. Gérer cette incertitude est d’ailleurs une partie du

défi scientifique de ce projet.

 

 

– Quelles sont les premières étapes?

 

 

 

– Nous discutons du projet avec Le Temps depuis presque un an. Notre équipe a déjà

commencé à travailler sur les archives pour commencer les premières extractions. Le

comité scientifique que nous avons formé, avec des historiens spécialistes des archives

de presse, des journalistes et la directrice de la Bibliothèque nationale suisse, se réunira

régulièrement au cours de l’année à venir afin de bien accompagner ces premières

étapes. Nous espérons pouvoir présenter les premiers résultats et mettre en ligne une

première version de ce moteur de recherche sémantique d’ici un an .

 

 

 

Search site

Contact

MAC ASTUCE1

ASTUCES INFORMATIQUE WINDOWS

17/03/2016 19:06

Bon plan, les meilleurs sites et applications pour mini budget

  Vous êtes un radin ou simplement n’aimez pas dépenser un sou !   Ne vous inquiétez pas vous n'êtes pas le seul, des applications et sites Web sont spécialement dédiés à ceux qui traquent  les bonnes affaires. Radins.com    accompagne les...

TOUTS SAVOIR SUR LES DRONES

13/03/2015 10:55

Le drone DJI capture l'image d'un objet volant non identifié

Le drone DJI aurait  filmé un objet volant non identifié au-dessus de la Silicon Valley. La vidéo fait grand bruit sur Internet et suscite les hypothèses les plus variées.  La vidéo a été mise en ligne le 8 mars. Les images auraient été tournées par un drone DJI...
08/03/2015 12:58

Le drone DJI S1000+ hexacopter photo pro

Le DJI S1000+ hexacopter est un drone prêt à voler et à capturer le summum de la photographie aérienne.   Si vous cherchez un drone professionnel pour des inspections, agricole de précision, la photographie, la cinématographie, l'arpentage et plus, le S-1000 est le...

 

BEAUTÉ A PETIT PRIX

03/12/2012 22:56

Comment prendre un bain adoucissant

    Quand on veut prendre un bain adoucissant, on peut se préparer le mélange maison soi-même et en plus il est naturel.   Il faut mélanger une demi-tasse de miel avec deux grosses cuillères d’essence de lavande et rajouter le tout dans...
 

  PARTENAIRE