|
|
Guide des moteurs de recherche
|
|
|
|
GENERALITES
Internet comporte en 2003 environ 10 milliards de pages Web présentant un contenu valable.Plus de 2 millions sont créées ou modifiées chaque jour
Malgré le rôle essentiel des répertoires ordonnés manuellement par des experts (Yahoo, bibliothèques, universités), il est indispensable de s'appuyer sur les moteurs de recherche fonctionnant à l'aide de robots
Cependant que la totalité des moteurs n'auraient indexé qu'environ 60% des pages Web " statiques" .
" Almost 50% of the database a search engine uses is either out-of-date, or incomplete at any given time. "
Ils ne peuvent évidemment connaître les " pages dynamiques" non préparées à l'avance mais qui sont composées immédiatement (" on the fly" ) à la demande d'un internaute lorsqu'il interroge une banque de données présente sur un serveur. Le nombre de ces pages s'élèverait alors à plusieurs dizaine de milliards
Le domaine des forums est moins bien connu ou indexé, et encore moins celui des listes de diffusion qui fonctionnent par la messagerie.
On ne connaît pas non plus le stock d'informations ou d'idees qui dorment dans le cerveau (reptilien) des 6 milliards d'êtres humains. Et cela vaut sans doute mieux ainsi...
< MOTEUR DE RECHERCHE SUR GEOSCOPIE>
Moteurs intelligents
|
SUR LES OUTILS DE RECHERCHE
En français http://www.idf.net/mdr
Pandia: portail des moteurs de recherche
Tous les moteurs :http://outils.abondance.com/moteurs.htmlTous les annuaires :http://outils.abondance.com/annuaires.html
http://www.lesmoteursderecherche.com
Abondance
Agentland
Veille
AskTibbs
Abc Doc
Fouineux Tous les outils linguistiques et engins de recherche (***)
Moteurzine:
Conseils de recherche
http://www.webrankinfo.com
En anglais:
Search Engine Watch
TheSpider's Apprentice, help on searching the Web. Analyze and rate the major search engines.
IBM infoMarket Search
Websearch Research Buzz Traffick
Search IQ SearchEngine News
Search Engine Watch
Searchengines.com
Search Engine Forums
RankWrite Roundtable
Spider-food - search engine positioning
SearchAbility Guides To Specialized Search Engines
http://www.annuaire-info-com/
http://www.e-annuaires.com
http://annuaires2004.com/
Librarians'Internet Index websites you can trust
Comprendre les moteurs de recherche
Major search Engines
|
UTILITE |
|
MODALITES-OUTILS
LES MOTEURS DE RECHERCHE
Ils recherchent à partir d'un mot ou d'une expression. On les trouvera tous dans ALL IN ONE. la plupart fonctionnent aussi comme des répertoires sauf Alta Vista, Open Text, Four11,HotBot. HotBot permet la recherche directe d'éléments HTML
GOOGLE
|
1°) en anglais
< ALTAVISTA > < HOTBOT > < LYCOS >
< EXCITE > < FOUR11> < INFOSEEK >
< OPENTEXT > < WEBCRAWLER > < INFORMANT > < NLIGHTN > < PlanetSearch >
2°) moteurs en français
< ECILA ou ECILA> < EXCITE > < FRANCITE > < LOKACE > < LYCOS> < Pages Web> |
LES METAMOTEURS DE RECHERCHE:
Ils rendent de grands services:
en interrogeant très rapidement à votre place plusieurs (voire plusieurs de dizaines de) moteurs dont ils connaissent parfaitement les syntaxes d'interrogation
ils rapatrient les pages trouvées, éliminent les doublons et dans certains cas, évaluent la pertinence (pourcentage d'occurrence des termes de recherche)
après consultation des répertoires thématiques, les métamoteurs sont presque indispensables pour une première découverte. On peut recommander un classique: Copernic, gratuit dans sa version de base
Ces courtiers de recherche effectuent leur travail en interrogeant d'autres robots. Les méthodes et outils évoluent tr ès vite: on peut les suivre sur BOTSPOT
Les meta-moteurs sont des systèmes capable d'envoyer des requêtes à plusieurs moteurs simultanément.
- Dogpile Un moteur qui recherche ses informations dans près de 25 moteurs, répartis en 4 catégories. Les opérateurs booléens sont supportés.
- ProFusion Un meta-moteur de recherche qui peut envoyer des requêtes dans 9 moteurs simultanément. Les résultats renvoyés par les moteurs sont analysés, et recombinés de façon à supprimer les adresses redondantes et les regrouper par degré de pertinence.
- Internet Sleuth Internet Sleuth possede la plus grande collection de moteurs de recherche de l'internet (près de 3000 !). Ce meta-moteur couvre également de nombreuses bases de données. Les moteurs sont organisés en 21 catégories principales et de nombreuses sous catégories.
- Savvy Search Méta-chercheur, Savvy Search envoye ses requêtes auprès de moteurs, de guides, de sites spécialisés ou de boutiques. Près de 200 adresses réparties en de nombreuses catégories.
- Debriefing Un meta-moteur proposant une interface de recherche sur le web français, via Yahoo, PagesWeb, Ecila, Infoseek, Excite, Lokace, ainsi qu'une recherche sur le web mondial (AltaVista, Yahoo, Infoseek, Excite, Webcrawler, Lycos). Les résultats des requêtes sont triés et les liens invalides supprimés.
- Go2Net | MetaCrawler Recherche simultanée dans 9 bases de données différentes.
- Méga Francité Méta-moteur francophone, Francité effectue sa recherche dans plus de 1500 moteurs (bases de données, jeux, mp3, etc...)
- TROUVEZ ! TROUVEZ ! vous permet de chercher simultanément dans 16 des principaux répertoires et moteurs de recherche. Les résultats de recherche s'affichent par ordre décroissant de pertinence.
- SuperSearch III Une interface permettant de rechercher dans plusieurs moteurs à la fois. Vous pouvez choisir la catégorie des moteurs auquels vous soumettez votre requête: Crawlers, Indices, Usenet, People, Meta, Articles, Software, et Unsorted.
|
1°) en anglais
< All in One> < Computer Network CINet>
< CLEARINGHOUSE> < SLEUTH > < METACRAWLER >
< METASEARCH >
< METAFIND> < SAVY SEARCH > < COPERNIC>
REFERENCE: recherche sur Web, newsgroups et listes de diffusion
2°) en français
< All in One> < Francité> < I-search: > < Info Internet>
< General Moteur: > < SAVY SEARCH >
< Debriefing> < 7alpha>
http://www.apocalx.com/ avec services pour webmasters
ARIANE6 a répertorié et classé plus de 1100 moteurs de recherche |
Moteurs spécialisés |
< Beaucoup>
Airport Search Engine - ASE database contains airport- codes and a list of links to airport pages on the web.
WebPort City Gateways
Aqueous - dedicated to sites that have water related content.
Aviation Search Engine from Totavia
Funny Site - search engine for humor sites.
MusicSearch - music search engine with over 5,000 links and growing.
Public Safety Search Engine - features law enforcement, fire and related web sites. Add your site or search for your favorite.
Travel-Finder Spider: travel related resources and information.
VirtualTourist |
SERVEURS COMMERCIAUX
|
|
ECHANGES |
|
EVALUATION
La responsabilité des moteurs de recherche Le tribunal de Paris a interdit, mercredi 5 septembre 2001, au moteur de recherche d'annonces d'emploi Keljob de référencer les fiches du site Cadremploi. Keljob a été condamné à payer 1 million de francs de dommages et intérêts. Cette jurisprudence sera, d'importance, car elle préfigure des problèmes qui pourraient arriver avec les index de pages web utilisés par les moteurs de recherche (...)http://www.sam-mag.com/archives/juridique13.htm |
Imi Tiki Les rencontres entre passionnés du monde des outils de recherche à Paris... et ailleurs !
Les moteurs de recherche Ambassade de France en Israel - 6 pages - 1/11/2003 |
PRESENTATION
Organisation de la recherche,
Présentation de l'information |
Moteurs en WEB2
Recherche
- Huckabuck, recherche multi moteur ( mon billet )
- Rollyo, pour créer votre propre service de recherche ( mon billet )
- Wikio, c'est vous qui créez l'info
- Xoolyx, service identique à wikio ( mon billet )
- Yoono, un moteur de recherche français
- Gridwell, recherche sur fil RSS
- Cooliris, un plugin FF permettant de voir ce que vous cherchez su Google ( mon billet )
- Inquisitor, recherche muti moteur (mon billet)
- Gnoos, moteur de recherche de blogs
- RSSmicro, recherche sur les fils RSS
- AlltheWeb, anticipe les mots que vous cherchez
- (::Opso::), recherche muti moteurs
- Gnosh, recherche multi moteurs
- ZabboWabbo, recherche multi moteurs
- Stalkerati, recherche multi moteurs
- MyWeb, le service de recherche Web 2.0 de Yahoo
- Zewol, recherche multi moteurs
- Qelly, moteur de recherche par catégories
- Zero-zero, moteur de recherche entierement consacré au Foot
- EyeSearch, moteur de recherche visuel
- local.ch, recherche en suisse
- Dumpr, recherche de photos similaires sur Flickr
- Foundd
- Cuppin', recherchez des cafés de différents pays
- mnemomap, recherche nouvelle génération
- Tambul, moteur nouvelle génération
- YurNet , multi moteur
- FeedGit, recherche de fil RSS
- TagFetch, multi moteurs
- Ipselon
- Vdoogle recherche de videos
- Quintura
- VideoNik recherche de videos
- Ms Dewey moteur presque interactif
- Google Co-op concevez votre moteur de recherche
- Resultr creez votre moteur
- PureVideo recherche de video
- SearchMash moteur de google
- Ty Bou
- Videoronk recherche et telechargement de video
- ScoopVid recherche de videos
- Ujiko
|
PERSPECTIVES
Le Web est un nœud papillon. A l'aile gauche, les pages ayant un lien vers d'autres pages mais qui ne reçoivent aucun lien . A l'aile droite, les pages pointées par d'autres mais qui ne renvoient à aucune autre (ex: formulaires de la SNCF). Au centre, les pages inconturnables et interconnectées. Il faut chercher l'information au cœur du Web avant d'en explorer la totalité. Donc:
- exploiter les liens entre les pages Pages de référence et Pages pivots
- analyser le contenu des documents: niveaux de langage, types de documents...
- accompagner l'internaute en précisant les requêtes, suggérant autres thèmes associés,
|
|
|
|
|
|