[ Yolin | 2001 | Sommaire ]

1.2.1.1.11 Les annuaires et moteurs de recherche

On estime en 2001 le nombre de documents publiées par les entreprises, les chercheurs, les institutions ou les particuliers à 1.300 milliards (ceci comprend en particulier toutes les bases de données) dont 2,5 Milliards accessibles par une recherche sur le Web et s'accroissent de 7 millions par jour dont 85% par des Américains!:

S'il est aisé de trouver un document dont vous connaissez l'adresse et, en suivant les "liens", de naviguer d'un document à l'autre à la recherche d'information, ce type de "navigation" au hasard sur le Web trouve rapidement ses limites:

Une des innovations majeures qui ont concouru au développement du Web sont les "Moteur de Recherche" et les annuaires

Ces outils informatiques puissants et conviviaux, permettent de trier parmi cette masse d'information considérable et il n'est pas exclu de trouver une aiguille dans une botte de foin parmi le milliard de documents qu'ils analysent et indexent (par exemple des informations juridiques, technologiques, commerciales,...)

Les recherches se font

Des "métamoteurs" font travailler en parallèle plusieurs moteurs et font une synthèse des résultats

Des "portails" (comme Yahoo!) associent annuaire, moteur de recherche (ils sous-traitent souvent le moteur à des entreprises comme Inktomi ou Google) et offrent de nombreux services

Par ailleurs les logiciels de traduction automatique, quoique encore perfectibles (on devrait plutôt parler d'outils de compréhension voir page 31), permettent de ne pas limiter sa recherche aux sites dont on comprend la langue

Ces moteurs sont utilisés plusieurs centaines de millions de fois par jour (RelevantKnowledge, oct 98)

Les plus visités sont de la catégorie "portail" ont pour nom Yahoo! www.yahoo.com, Excite www.excite.com, Infoseek www.infoseek.com, Lycos www.lycos.com, HotBot www.hotbot.com ou Alta Vista www.altavista.com,

Dans la catégorie "métamoteurs Parmi les plus connus : MetaCrawler www.metacrawler.com Mega Francité http://mega.francite.com, SavvySearch www.savvysearch.com, Fast Search www.alltheweb.com et surtout Google http://google.com 100 millions de requêtes par jour, qui référence plus d'un milliard de pages et est considéré par beaucoup comme le plus efficace [4]

Notons également Kartoo, www.kartoo.com, qui présente les résultats de ses recherches sous forme graphique à partir d'une analyse sémantique des sites trouvés, permettant une recherche intuitive, par approximations successives extrêmement intéressante

Pour les moteurs francophones citons, outre les déclinaisons spécialisées des moteurs américains, Voilà www.voilà.fr ou Lokace www.lokace.fr,),

d'autres moteurs plus spécialisés, prenant acte du fait que les moteurs généralistes ont du mal à suivre l'explosion du nombre de sites et n'en référencent plus qu'une partie, permettent de meilleurs résultats dans certains domaines

La recherche d'adresses avec Voilà www.adressemail.voilà.fr Yahoo! Annuaires http://fr.people.yahoo.com Lycos WhoWhere http://french.whowhere.lycos.com,

La recherche d'emploi Keljob.com www.keljob.com

La recherche de logiciels avec Filez.com www.filez.com,

La recherche d'hébergeur www.abchebergement.com

La gastronomie avec Gourmetsecker www.gourmetsecker.com  , EatinParis www.eatinparis.com

Le monde agricole Web-agri http://www.Web-agri.com

Ou une région Click'in! Auvergne http://clickin.gdebussac.fr , Nantes www.cybernantes.com ,la façade atlantique www.alouest.net , Breizhoo www.breizhoo.com pour la Bretagne

Certains moteurs permettent également de rechercher de la musique comme http://mp3search.lycos.com ,

Notify http://cs.uni-bonn.de/info5/index-ge.html de Michael Clausen reconnaît les morceaux de musique en une fraction de seconde : lorsqu'on lui donne une brève série de notes, le programme parcourt une énorme banque de données de plus de 12 000 morceaux et retrouve la mélodie recherchée. A l'avenir, le programme devrait même pouvoir reconnaître une mélodie qui serait chantonnée ou sifflée dans un micro. Frank Kurth, un collaborateur du professeur Clausen, travaille sur une variante de ce appelée "audentify" qui devrait par exemple non seulement reconnaître un morceau de musique classique comme étant "Les quatre saisons de Vivaldi" mais en plus savoir qu'il s'agit de la version du 15 mars jouée dans la salle Beethoven a Bonn et non pas a la philharmonie de Berlin Source : Herve Loquais, Handelsblatt 7.05.2001

voire même des image ou vidéo avec LTU Technologies (ex-lookthatup) www.ltutech.com (recherche d'objet sur ebay, d'images illicites, Media Finder http://image.altavista.com ou www.compaq.com/speechbot

L'Inria a développé Surfimage qui permet de retrouver les images qui " ressemblent " le plus au modèle proposé www-rocq.inria.fr/cgi-bin/imedia/surfimage.cgi qui sera développé par la start-up Elucid Technologie

Ya-Hooka www.yahooka.com est spécialisé dans le cannabis (le Monde 16/5/00)

pour un panorama complet et à jour sur les moteurs, avec banc d'essai, classement par catégorie,... voir www.lapasserelle.com/sm/formation_veille.html www.abondance.com, www.searchengines.net, www.beaucoup.com, www.search.com, http://searchenginewatch.com http://solutions.journaldunet.com/dossiers/moteurs/sommaire.shtml

de logiciels spécialisés dans l' intelligence économique compétitive permettent, comme nous le verrons plus loin, des recherches beaucoup plus élaborées voir page 153

sur Evariste sur le Web
nous écrire
Evariste ©1996-2007
URL : http://www.evariste.org/new/index.html

(Last update : Fri, 9 Feb 2007)