|
web
invisible (JP Lardy)

Article
Comment choisir et utiliser des mots clés sur le web
Plus d'outils
:
Tous
les outils
en une page /Urfist Lyon)
Voir aussi ;
Fouineux.com
|
|
Pour se repérer dans
l'énorme
masse des ressources accessibles sur Internet,
différentes
sortes d'outils sont disponibles, entièrement automatiques,
comme les robots, ou contrôlés
humainement commes
tous
les autres..
Les robots (appelés
aussi
"moteurs de recherche") sont des outils d'exploration
nés avec le web. Ils sont très efficaces, mais ils
n'explorent qu'une partie des ressources, laissant de côté
le "web invisible". Ce sont aussi maintenant des outils
commerciaux, non contrôlés par des instances scientifiques
ou démocratiques, dont les règles de fonctionnement
constituent des secrets de fabrication.
Il est donc très important de connaître les autres
instruments de recherche : sites
d'orientation et portails disciplinaires, répertoires, banques
de données, catalogues et portails de bibliothèques,
correspondant au domaine étudié.
Ces sites donnent accès à des ressources souvent
"invisibles" pour les robots, mais surtout à des ressources
validées, sélectionnées par des
spécialistes, selon des
procédures offrant certaines garanties scientifiques. Un
étudiant débutant trouvera là des repères
indispensables pour évaluer la qualité des ressouces
récoltées par des robots.
Une même question peut
trouver réponse
de plusieurs manières, mais, selon la nature de la recherche,
certains
outils se révèlent plus efficaces pour apporter
rapidement
des réponses pertinentes. Le tableau ci-dessous s'efforce de
guider
votre choix et liste quelques outils.
N'oubliez pas, lorsque vous trouvez des
ressources
utiles, d'en enregistrer l'adresse dans vos signets
personnels. Vous pourrez ainsi
complèter
pour votre usage la sélection de ressources offertes par les
pages "Pistes
sur Internet". Pensez aussi
à
vous assurer de la qualité
des sites repérés.
1 - Moteurs
de recherche
entièrement automatiques :
| Outils et Usage |
une
sélection |
Robots
de recherche généralistes
Outils entièrement automatiques,
interrogeables par formulaire
de requête.
Très puissants, ils explorent automatiquement les sites (sur
les noms des documents, les titres, les mots du texte, le code
source...), et
constituent
ainsi un énorme stock de données à partir
desquelles
les questions posées trouvent réponses.
Très
utiles
pour des questions précises, ils restent
efficaces
à condition d'éviter les termes polysémiques ou
trop
larges.
Inconvénients
: les résultats sont fournis en très grand nombre,
dans un ordre incompréhensible, les documents
intéressants
obtenus sont mélés à des ressources
dépourvues
d'intérêt et à une publicité
envahissante.
Les robots se différencient pricipalement par la
taille et la
qualité de leur corpus (pages indexées) et par leurs
critères
de présentation des résultats de requête.
Pour en savoir plus sur les robots
: Critères d'analyse.
Les indications fournies dans la rubrique d'aide ou le
recours au module
"recherche avancée" permettent d'obtenir des résultats
plus
pertinents.
|
Cybermondiaux
et francophones
Exalead
<http://www.exalead.com/cgi/exalead> propose
une
série
de mots-clés associés à la question posée.
Il indexera bientôt les références des 13 millions
d'articles scientifiques de l'Inist, ce qui lui donnera aussi valeur de
robot "académique".
Google en
français
<http://www.google.com/intl/fr/> réponses
pertinentes,
corpus très important, critères de présentation
des
résultats liés à la fréquence d'usage
Voir Aussi
Alltheweb <http://www.alltheweb.com/>
corpus important, (images, sons video..), présentation claire
des
résultats.
Meta-robots
Kartoo
<http://www.kartoo.com/>
Interface cartographique avec affichage d'un réseau
sémantique.
Metacrawler
<http://www.metacrawler.com/index.html>
Rapide, tri des doublons et présentation des résultats
par ordre de pertinence (cités par plusieurs robots)
|
Robots-annuaires
de sites
Le plus souvent associés à des
robots, ils offrent à la fois un formulaire de
requête
et des rubriques organisées en thèmes et
sous-thèmes par des indexeurs humains.
Cette double entrée les rend faciles à utiliser et
efficaces.
Cependant, ils visent un large
public et leur indexation est sommaire.
Le passage des rubriques de l'annuaire à
l'exploration
du web rend assez confuse la lecture des résultats de
requête et la part de plus en plus faible de la sélection
humaine les range
du côté des outils offrant des ressources non
validées.
|
Francophones
Voila <http://www.voila.fr/>
Yahoo France <http://www.yahoo.fr>
Cybermondiaux
Yahoo <http://www.yahoo.com>
EINet Galaxy <http://galaxy.einet.net/>
|
Robots
"académiques" spécialisés
Ils ont les mêmes caractéristiques techniques et les
mêmes
modalités de fonctionnement que les robots
généralistes,
mais leur "corpus" est limité à des types de documents
utiles
pour l'étude, souvent scientifiquement validés, dont
beaucoup en texte intégral, collectés sur
différents
sites.
Le signalement bibliographique est libre d'accès, alors que
la consultation du texte intégral des documents peut être
gratuite ou payante, d'accès libre ou contôlé, en
fonction des dispositions du site d'origine.
Ces outils présentent également les résultats
de requête sous une forme lisible et homogène.
Etant donné la nature des documents constituant leur corpus, ces outils présentent un grand
intérêt pour la recherche documentaire, mais les
règles de sélection du corpus et de présentation
des résultats ne sont pas toujours cohérentes ni
explicites....
En savoir plus sur Google Scholar: Cours Urfist Lyon (format pdf) |
Commerciaux
Google Scholar
(encore en
test) <http://scholar.google.com/>
spécialisé
dans la recherche de documents scientifiques et universitaires, il
signale des articles, des résumés et des citations.
Google Print (encore
en test) <http://print.google.fr/>,
effectue le recherche sur le texte intégral d'ouvrages
numérisés
que ggogle propose en association avec des bibliothèques
américaines
et des éditeurs. Il indique les pages précisément
concernées par la requête.
Institutionnels
Portail
documentaire Sudoc
<http://www.portail-sudoc.abes.fr/>
La recherche est effectuées sur un ensemble documentaire fiable
(catalogues et bibliographies,thèses, production scientifique,
fonds
numérisés, sites de référence)
Oaister
<http://oaister.umdl.umich.edu/o/oaister/>
recherche sur un ensemble d'archives ouvertes produites par 480
institutions
de recherche dans le monde.
Science Research <http://scienceresearch.com>
explore banques de données et publications scientifiques en
libre
accès, catalogue de la Library of Congress... |
2 - Sélection par des
responsables scientifiques de ressources validées
Sites
d'orientation
Ces sites, d'intérêt universitaire,
généralistes
ou spécialisés dans un domaine, assurent des repères
et constituent des moyens de formation.
Ils
permettent de
débuter une recherche documentaire à partir de sites
validés par des spécialistes
Ces points de départ guident la démarche et
présentent
les outils de recherche et les ressouces utiles sur Internet dans un
cursus
universitaire.
Il ne faut cependant pas hésiter à sortir des pistes
proposées lorsqu'elles ne sont pas suffisantes. |
Cerise
/Pistes sur Internet
<http://www.ccr.jussieu.fr/urfist/cerise/p71.htm>
Rechercher
sur Internet/Educnet <http://www.educnet.education.fr/dossier/rechercher/>
Sapristi
-
Sentiers d'Accès et Pistes de Recherche d'Informations
Scientifique
et Techniques sur Internet <http://docinsa.insa-lyon.fr/sapristi/index.php>
Les Signets de la
Bibliothèque
Nationale de France
<http://signets.bnf.fr/>
Sans oublier le site de votre bibliothèque
universitaire...
|
Index
et Meta-index thématiques
Souvent pris en charge par des institutions à vocation
éducative, ils sont organisés en listes
hiérarchisées
pointant sur des ressources sélectionnées et parfois
commentées
par un spécialiste.
Recherche à partir de la liste des domaines et sous-domaines.
Certains index sont également assortis d'un formulaire de
requête.
Ces index permettent d'accéder rapidement à des
ressources
dont la qualité est vérifiée.
Ils
donnent une vue
d'ensemble des ressources dans un domaine ou une discipline
universitaire
et permettent de les explorer sans perte de temps.
Cependant, il arrive que le contrôle scientifique
soit défaillant
et la mise à jour irrégulière...
|
Portails
disciplinaires
CISMEF, Sites
médicaux
francophones <http://www.chu-rouen.fr/cismef/>
Menestrel,
médiévistes sur Internet <http://urfist.enc.sorbonne.fr/mediev.htm>
Voir aussi : Sites
spécialisés
par discipline
Multidisciplinaires
The WWW Virtual Library <http://vlib.org/>
Le plus ancien répertoire du Web, pris en charge par domaines
de manière répartie par des experts de diverses
institutions,
responsables de la sélection et de la mise à jour.
L'ensemble
est ainsi constitué de plus de 300 "bibliothèques
virtuelles",
de qualité inégale.
BUBL LINK <http://bubl.ac.uk/link/>
Catalogue de ressources, classées par rubriques et
sous-rubriques,
indexées en Dewey. Plus de 11 000 références
décrites
et évaluées,
Lii.Org / Librarians'Index to the
Internet <http://lii.org/>
Près de 10.000 ressources anglophones
sélectionnées
et évaluées par un collectif d'une centaine de
bibliothécaires
californiens.
Intute <http://www.intute.ac.uk/>
Répertoire institutionnel de ressources décrites et
évaluées, pour l"éducation et la recherche.
|
Répertoires
Organisés en liste alphabetique ou sous forme de banque de
données,
comme les répertoires papier, interrogeables par
l'intermédiaire
d'un index alphabétique ou par formulaire de requête.
Ils
fournissent rapidement
les coordonnées d'un ensemble d'organismes ou de ressources de
même
nature.
Assurez-vous cependant de la fiabilité du site,
de son caractère
non commercial et de la fréquence de sa mise à jour.
D'autres répertoires, par type de documents, sont
indiqués
dans les pages :
"Pistes sur internet"
|
Services Internet
de l'Administration Française
Service Public <http://www.service-public.fr/>
Bibliothèques.
Catalogue Collectif de
France <http://www.ccfr.bnf.fr/>
CNRS
Annuaire
des Laboratoires de recherche du CNRS <http://web-ast.dsi.cnrs.fr/l3c/owa/annuaire.recherche>
.
Musées
français.
Museofile <http://museofile.culture.fr/>
Revues
DOAJ Directory of
open
access journal <http://www.doaj.org/>
liens sur des revues académiques gratuites en texte
intégral,
principalement anglophones, toutes les disciplines.
|
Catalogues
et banques de données
Répertoires spécialisés de documents ou d'objet,
produits par les bibliothèques, les musées,
éditeurs,
libraires...
Pour
établir
une bibliographie ou localiser des documents. |
voir : Catalogues de
bibliothèques
voir : Banques de données
bibliographiques
|
|