Instruments de recherche
 



 



web invisible (JP Lardy)

Prelude
Article

Comment choisir et utiliser des mots clés sur le web


































Plus d'outils
:
Tous les outils en une page /Urfist Lyon)

Voir aussi ;
Fouineux.com


Pour se repérer dans l'énorme masse  des ressources accessibles sur Internet,  différentes sortes d'outils sont disponibles, entièrement automatiques, comme les robots, ou contrôlés humainement commes tous les autres.. 
Les robots (appelés aussi "moteurs  de recherche") sont  des outils d'exploration nés avec le web. Ils sont très efficaces, mais ils n'explorent qu'une partie des ressources, laissant de côté le "web invisible". Ce sont aussi maintenant des outils commerciaux, non contrôlés par des instances scientifiques ou démocratiques, dont les règles de fonctionnement constituent des secrets de fabrication.

Il est donc très important de connaître les autres instruments de recherche : sites d'orientation et portails disciplinaires, répertoires, banques de données, catalogues et portails de bibliothèques, correspondant au domaine étudié.
Ces sites donnent accès à des ressources souvent "invisibles" pour les robots, mais surtout à des ressources validées, sélectionnées par des spécialistes, selon des procédures offrant certaines garanties scientifiques. Un étudiant débutant trouvera là des repères indispensables pour évaluer la qualité des ressouces récoltées par des robots.

Une même question peut trouver réponse de plusieurs manières, mais, selon la nature de la recherche, certains outils se révèlent plus efficaces pour apporter rapidement des réponses pertinentes. Le tableau ci-dessous s'efforce de guider votre choix et liste quelques outils. 
N'oubliez pas, lorsque vous trouvez des ressources utiles, d'en enregistrer l'adresse dans vos signets personnels. Vous pourrez ainsi complèter pour votre usage la sélection de ressources offertes par les pages "Pistes sur Internet".  Pensez aussi à vous assurer de la qualité des sites repérés.


questions précises:  Robots de recherche
recherches de "vie quotidienne"
Robots-Annuaires de sites
documents d'étude Robots  "académiques" spécialisés

commencer une recherche documentaire:
Sites d'orientation
ressources dans une discipline universitaire:  Index et Meta-index thématiques
coordonnées d'institutions et de services:  Répertoires
établir une bibliographie:  Catalogues et banques de données

1 - Moteurs de recherche entièrement automatiques :
Outils et Usage une  sélection 
Robots de recherche généralistes
Outils entièrement automatiques, interrogeables par formulaire de requête.
Très puissants, ils explorent automatiquement les sites (sur les noms des documents, les titres, les mots du texte, le code source...),  et constituent ainsi un énorme stock de données à partir desquelles les questions posées trouvent réponses.
Très utiles pour des questions précises, ils restent efficaces à condition d'éviter les termes polysémiques ou trop larges.

Inconvénients :  les résultats sont fournis en très grand nombre, dans un ordre incompréhensible, les documents intéressants obtenus  sont mélés à des ressources dépourvues d'intérêt  et à une publicité envahissante.  

Les robots se différencient pricipalement par la taille et la qualité de leur corpus (pages indexées) et par leurs critères de présentation des résultats de requête.
Pour en savoir plus sur les robots : Critères d'analyse.

Les indications fournies dans la rubrique d'aide ou le recours au module "recherche avancée" permettent d'obtenir des résultats plus pertinents.

Cybermondiaux et francophones
Exalead <http://www.exalead.com/cgi/exalead> propose une série de mots-clés associés à la question posée. Il indexera bientôt les références des 13 millions d'articles scientifiques de l'Inist, ce qui lui donnera aussi valeur de robot "académique".
Google en français <http://www.google.com/intl/fr/> réponses pertinentes, corpus très important, critères de présentation des résultats liés à la fréquence d'usage 
Voir Aussi 
Alltheweb <http://www.alltheweb.com/> corpus important, (images, sons video..), présentation claire des résultats. 

Meta-robots
Kartoo <http://www.kartoo.com/>
Interface cartographique avec affichage d'un réseau sémantique.
Metacrawler <http://www.metacrawler.com/index.html>
Rapide, tri des doublons et présentation des résultats par ordre de pertinence (cités par plusieurs robots)

Robots-annuaires de sites
Le plus souvent associés à des robots, ils offrent à la fois un formulaire de requête et des  rubriques organisées en thèmes et sous-thèmes par des indexeurs humains. Cette double entrée les rend faciles à utiliser et efficaces. 
Cependant,  ils visent un large public et leur indexation est sommaire. 
Le passage des rubriques de l'annuaire à l'exploration du web rend assez confuse la lecture des résultats de requête et la part de plus en plus faible de la sélection humaine les range du côté des outils offrant des ressources non validées.
Francophones
Voila <http://www.voila.fr/>
Yahoo France <http://www.yahoo.fr>
 

Cybermondiaux
Yahoo <http://www.yahoo.com>
EINet Galaxy <http://galaxy.einet.net/>

Robots "académiques" spécialisés 
Ils ont les mêmes caractéristiques techniques et les mêmes modalités de fonctionnement que les robots généralistes, mais leur "corpus" est limité à des types de documents utiles pour l'étude, souvent scientifiquement validés, dont beaucoup en texte intégral, collectés sur différents sites.

Le signalement bibliographique est libre d'accès, alors que la consultation du texte intégral des documents peut être gratuite ou payante, d'accès libre ou contôlé, en fonction des dispositions du site d'origine.
Ces outils présentent également les résultats de requête sous une forme lisible et homogène.

Etant donné la nature des documents constituant leur corpus, ces outils présentent un grand intérêt pour la recherche documentaire, mais les règles de sélection du corpus et de présentation des résultats ne sont pas toujours cohérentes ni explicites....

En savoir plus sur Google Scholar: Cours Urfist Lyon (format pdf)
Commerciaux
Google Scholar (encore en test) <http://scholar.google.com/>  spécialisé dans la recherche de documents scientifiques et universitaires, il signale des articles, des résumés et des citations.
Google Print (encore en test) <http://print.google.fr/>, effectue le recherche sur le texte intégral d'ouvrages numérisés que ggogle propose en association avec des bibliothèques américaines et des éditeurs. Il indique les pages précisément concernées par la requête.

Institutionnels
Portail documentaire Sudoc <http://www.portail-sudoc.abes.fr/>  La recherche est effectuées sur un ensemble documentaire fiable (catalogues et bibliographies,thèses, production scientifique, fonds numérisés, sites de référence)
Oaister <http://oaister.umdl.umich.edu/o/oaister/> recherche sur un ensemble d'archives ouvertes produites par 480 institutions de recherche dans le monde.
Science Research <http://scienceresearch.com> explore banques de données et publications scientifiques en libre accès, catalogue de la Library of Congress...


2 - Sélection par des responsables scientifiques de ressources validées

Sites d'orientation 
Ces sites, d'intérêt universitaire,  généralistes ou spécialisés dans un domaine, assurent des repères et constituent des moyens de formation.
Ils permettent de débuter une recherche documentaire à partir de sites validés par des spécialistes
Ces points  de départ guident la démarche et présentent les outils de recherche et les ressouces utiles sur Internet dans un cursus universitaire.
Il ne faut cependant pas hésiter à sortir des pistes proposées lorsqu'elles ne sont pas suffisantes.
Cerise /Pistes sur Internet
<http://www.ccr.jussieu.fr/urfist/cerise/p71.htm>

Rechercher sur Internet/Educnet <http://www.educnet.education.fr/dossier/rechercher/>

Sapristi - Sentiers d'Accès et Pistes de Recherche d'Informations Scientifique et Techniques sur Internet <http://docinsa.insa-lyon.fr/sapristi/index.php>

Les Signets de la Bibliothèque Nationale de France
<http://signets.bnf.fr/>

Sans oublier le site de votre bibliothèque universitaire...

Index et Meta-index thématiques
Souvent pris en charge par des institutions  à vocation éducative, ils sont organisés en  listes hiérarchisées pointant sur des ressources sélectionnées et parfois commentées par un spécialiste
Recherche à partir de la liste des domaines et sous-domaines. Certains index sont également assortis d'un formulaire de requête. Ces index permettent d'accéder rapidement à des ressources dont la qualité est vérifiée.
Ils donnent une vue d'ensemble des ressources dans un domaine ou une discipline universitaire et permettent de les explorer sans perte de temps.

Cependant, il arrive que le contrôle scientifique soit défaillant et la mise à jour  irrégulière...

Portails disciplinaires
CISMEF, Sites médicaux francophones <http://www.chu-rouen.fr/cismef/>
Menestrel, médiévistes sur Internet <http://urfist.enc.sorbonne.fr/mediev.htm>

Voir aussi : Sites spécialisés par discipline

Multidisciplinaires

The WWW Virtual Library <http://vlib.org/>
Le plus ancien répertoire du Web, pris en charge par domaines de manière répartie par des experts de diverses institutions, responsables de la sélection et de la mise à jour. L'ensemble est ainsi constitué de plus de 300 "bibliothèques virtuelles", de qualité inégale.
BUBL LINK  <http://bubl.ac.uk/link/>
Catalogue de ressources, classées par rubriques et sous-rubriques, indexées en Dewey. Plus de 11 000 références décrites et évaluées,
Lii.Org / Librarians'Index to the Internet <http://lii.org/> 
Près de 10.000 ressources anglophones sélectionnées et évaluées par un collectif d'une centaine de bibliothécaires californiens.
Intute <http://www.intute.ac.uk/>
Répertoire institutionnel de ressources décrites et évaluées, pour l"éducation et la recherche.

Répertoires
Organisés en liste alphabetique ou sous forme de banque de données, comme les répertoires papier, interrogeables par l'intermédiaire d'un index alphabétique ou par formulaire de requête.
Ils fournissent rapidement les coordonnées d'un ensemble d'organismes ou de ressources de même nature.

Assurez-vous cependant de la fiabilité du site, de son caractère non commercial et de la fréquence de sa mise à jour.

D'autres répertoires, par type de documents, sont indiqués dans les pages :
"Pistes sur internet"

Services Internet de l'Administration Française
Service Public <http://www.service-public.fr/>

Bibliothèques.
Catalogue Collectif de France <http://www.ccfr.bnf.fr/>

CNRS
Annuaire des Laboratoires de recherche du CNRS <http://web-ast.dsi.cnrs.fr/l3c/owa/annuaire.recherche> .

Musées français.
Museofile <http://museofile.culture.fr/>

Revues
DOAJ Directory of open access journal <http://www.doaj.org/> liens sur des revues académiques gratuites en texte intégral, principalement anglophones, toutes les disciplines.  

Catalogues et banques de données
Répertoires spécialisés de documents ou d'objet, produits par les  bibliothèques, les musées, éditeurs, libraires...
Pour établir une bibliographie ou localiser des documents.
voir : Catalogues de bibliothèques

voir : Banques de données bibliographiques




Chercher sur Internet
  • Les ressources Internet
  • Pistes sur Internet
  • Instruments de recherche
  • Guides pour internautes débutants
  • Comment évaluer la qualité d'un site ?
  • Exemple de parcours sur Internet

  • <http://urfist.enc.sorbonne.fr/cerise/p72.htm> Maj 26-09-2007/CP
      Cerise Copyright © 1999