vendredi, septembre 02, 2005

Moteur de recherche d'entreprise : la course au multi sources

Depuis quelques années le leader Verity offre des connecteurs vers des sources complexes à indexer : Notes et Documentum notamment.
Cette tendance s'accélère avec une demande de plus en plus forte au sein des entreprises de regrouper à l'intérieur d'une même application de recherche des sources d'un même thème mais de formats différents : sites Web, file system, BDD, ECM, RSS, GED ...
Parmi ceux-ci Lotus Notes reste l'une des plus complexe à adresser du fait particulier d'un haut niveau de sécurité. Dans ce type d'environnement, les solutions proposées n'ont pas le même niveau.
Autonomy, Exalead, Go Albert, Lingway, Sinequa, Triplehop proposent ou font évoluer leurs solutions dans ce sens.
Cette direction me semble inéluctable : il faudra répondre à ce besoin impératif.

IBM met sa technologie de recherche dans le domaine libre

Vu sur VNUnet.fr
IBM mettrait à diposition non seulement les fonctions de recherches mais aussi des fonctionnalités d'extraction de connaissances.
"Quelque 15 compagnies, notamment Attensity, ClearForest, Endeca, Factiva, Kana, Inquira, iPhrase, Inxight, nStein, QL2, SAS, Schemalogic, Semagix, SPSS et Temis prévoient se servir de UIMA comme cadre de travail pour la recherche et l'analyse de texte à l'intérieur de données non structurées, déclare IBM"

Effectivement l'extraction de connaissance, marginale il y a seulement quelques dizaines de mois, prend de plus en plus de place dans les applications de veille mais aussi dans les applications de recherche.

L'information ainsi extraite de texte libre et non strcuturé, permet d'enrichir les possibilités données à l'utilisateur de cibler plus précisément le contenu recherché : nom de personne, de produit, date, lieu, source ...

Il est fort probable que d'autres éditeurs, ayant une technologie à prédonminance statistique, n'ayant pas encore ce type de fonctionnalités, se joignent aux sociétés annoncées afin de se servir de UIMA et c'est une très bonne nouvelle.