A tale of two islands

Si vous êtes un ancien utilisateur de Papers et que vous n’avez pas essayé l’outil QueryPic de Tim Sherratt, vous voudrez peut-être le consulter. Il utilise l’API DigitalNZ pour rechercher dans les documents la fréquence des termes de recherche et les graphiques des résultats. Si cela n’a aucun sens, jetez un coup d’œil à cet exemple: « Île du Sud » par rapport à « Île du Milieu ».

 Résultats d
Résultats des requêtes pour « Middle Island » contre « South Island ».

J’ai regardé beaucoup de cartes ces derniers temps, et j’ai commencé à me demander quand l’île du Sud (comme nous l’appelons) a cessé d’être appelée l’île du Milieu (comme elle apparaît sur de nombreuses cartes historiques). Le graphique suggère qu’entre 1880 et 1890, « l’île du Sud » a commencé à être davantage utilisée, et en 1900, « l’île du Milieu » n’était guère utilisée du tout.

Mais il y a plus: cliquer sur les points sur QueryPic affiche les 20 premiers résultats de recherche pour cette année. Cliquer sur le petit point rouge pour  » Middle Island  » en 1907 révèle trois articles, expliquant qu’en juillet de la même année, l’Hon. R. McNab a donné des instructions au Service des terres et de l’arpentage selon lesquelles le nom de Middle Island ne doit pas être utilisé à l’avenir.

La Star de la Tamise a un article intéressant sur d’autres noms utilisés, mais cette histoire de tablette néo-zélandaise explique beaucoup mieux les « pièges verbaux divers »:

 Article de journal sur
Tablette de Nouvelle-Zélande, 1er août 1907, Page 22

J’ai appris toutes sortes de choses de cet exercice. Par exemple, Aotearoa n’était le nom maori de l’île du Nord qu’à cette époque, pas pour la Nouvelle-Zélande dans son ensemble. (Wikipédia le confirme.)

QueryPic est une nouvelle façon d’entrer dans les documents passés, et mais il y a un ou deux problèmes que vous devez comprendre avant de vous y fier. Tout d’abord, comme le note @wragge lui-même:

DigitalNZ recherche actuellement uniquement les titres des articles, tandis que Trove recherche le texte intégral. Cela signifie que les résultats totaux pour les articles passés sont inférieurs à ce à quoi vous pourriez vous attendre. Il est également difficile de créer des comparaisons significatives entre les pays. J’espère que cela changera à l’avenir.

Deuxièmement, il n’y a que 70 titres dans les articles précédents, mais des centaines ont été publiés en Nouvelle-Zélande, vous n’obtenez donc pas une couverture complète, ni même un échantillon représentatif.

Troisièmement, DigitalNZ a indexé le titre de chaque journal, et parfois le lieu où il est publié.

Pris en combinaison, cela signifie que certains mots et phrases fausseront vos résultats. Par exemple, jetez un œil à la recherche de « Wellington » et « Evening Post ».

 Résultats d'une étude sur Wellington et Evening post.
Résultats des requêtes pour « Wellington » et « Evening Post

Le graphique suggère qu’en 1839 et 1841, tous les articles des journaux précédents concernaient Wellington. Ce qui s’est réellement passé, c’est que chaque article de ces années-là provient de la « New Zealand Gazette et du Wellington Spectator », et DigitalNZ inclut le titre du journal dans ses recherches. De même, la majorité des articles publiés à partir des années 1920 proviennent du Evening Post.

Une recherche pour Auckland, « New Zealander » et « Auckland Star » révèle une nouvelle ride: chaque article du Néo-Zélandais est renvoyé par une recherche d’Auckland, même si le mot « Auckland » ne figure pas dans le texte. En bref, vous devez être prudent si vous recherchez des noms de lieux ou de journaux.

Voici d’autres comparaisons intéressantes:

 Résultats de recherche pour 'Beurre' et 'Margarine'.
Résultats de recherche pour « Beurre » et « Margarine.
 Résultats de QUERYPIC pour
Résultats de QueryPic pour « Rugby » et « Cricket ».
 Résultats de QueryPic pour beaucoup de sports.
Résultats de QueryPic pour beaucoup de sports – une enquête plus approfondie est nécessaire pour déterminer de quel type de « football » les journaux parlaient.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.