Анализ цитирования

Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Анализ цитирования - это изучение частоты, закономерностей и графиков цитирования в документах. Он использует ориентированный граф цитирований - ссылок из одного документа в другой - для раскрытия свойств документов. Типичная цель - определить наиболее важные документы в коллекции. Классический пример - это цитаты между академическими статьями и книгами. [1] [2] В качестве другого примера, судьи поддерживают свои решения , ссылаясь на решения, вынесенные по более ранним делам (см. Анализ цитирования в правовом контексте ). Дополнительным примером являются патенты, содержащие сведения об уровне техники., ссылка на более ранние патенты, относящиеся к данной заявке.

Документы могут быть связаны со многими другими функциями помимо цитат, такими как авторы, издатели, журналы, а также их фактические тексты. Общий анализ коллекций документов известен как библиометрия, и анализ цитирования является ключевой частью этой области. Например, библиографическая связь и совместное цитирование - это меры ассоциации, основанные на анализе цитирования (общие цитаты или общие ссылки). Цитаты в коллекции документов также могут быть представлены в таких формах, как график цитирования , как указал Дерек Дж. Де Солла Прайс в своей статье 1965 года «Сети научных публикаций». [3] Это означает, что анализ цитирования опирается на аспекты анализа социальных сетей.и сетевая наука .

Ранним примером автоматической индексации цитирования был CiteSeer , который использовался для цитирования между научными статьями, в то время как Web of Science является примером современной системы, которая включает в себя не только академические книги и статьи, отражающие более широкий спектр источников информации. Сегодня автоматическое индексирование цитирования [4] изменило природу исследований по анализу цитирования, позволяя анализировать миллионы цитат для выявления крупномасштабных закономерностей и открытия новых знаний . Инструменты анализа цитирования могут использоваться для расчета различных показателей воздействия на ученых на основе данных из индексов цитирования . [5] [6] [7]У них есть различные приложения, от определения экспертов-рецензентов для проверки работ и предложений о грантах, до предоставления прозрачных данных в поддержку решений по оценке академических заслуг, срокам пребывания и продвижению по службе. Эта конкуренция за ограниченные ресурсы может привести к этически сомнительному поведению по увеличению цитируемости. [8] [9]

Много критики было высказано в отношении практики наивного использования анализа цитирования для сравнения влияния различных научных статей без учета других факторов, которые могут повлиять на модели цитирования. [10] Среди этих критических замечаний один повторяющийся фокусируется на «факторах, зависящих от поля», которые относятся к тому факту, что практика цитирования различается от одной области науки к другой и даже между областями исследований в рамках дисциплины. [11]

Обзор [ править ]

Хотя индексы цитирования изначально были разработаны для поиска информации , они все чаще используются для библиометрии и других исследований, связанных с оценкой результатов исследований. Данные о цитировании также являются основой популярного импакт-фактора журнала .

Существует большое количество литературы по анализу цитирования, иногда называемому наукометрией , термин, изобретенный Василием Налимовым , или, более конкретно, библиометрикой . Эта область расцвела с появлением Индекса научного цитирования , который теперь охватывает литературную литературу с 1900 года. Ведущими журналами в этой области являются Scientometrics , Informetrics и Journal of the Association for Information Science and Technology . ASIST также ведет список электронной рассылки под названием SIGMETRICS в ASIST. [12]Этот метод возрождается благодаря широкому распространению баз данных подписки Web of Science и Scopus во многих университетах, а также общедоступным бесплатным инструментам цитирования, таким как CiteBase , CiteSeerX , Google Scholar и бывшая версия Windows Live Academic (теперь доступна с дополнительные функции как Microsoft Academic ). Методы исследования цитирования включают качественный, количественный и вычислительный подходы. Основные направления таких наукометрических исследований включали сравнение производительности, рейтинги институциональных исследований, рейтинги журналов [13], устанавливающие производительность преподавателей и стандарты пребывания в должности, [14]оценка влияния ведущих научных статей [15], отслеживание траектории развития области науки или техники [16] и разработка профилей ведущих авторов и учреждений с точки зрения результатов исследований. [17]

Юридический анализ цитирования - это метод анализа цитирования для анализа юридических документов, чтобы облегчить понимание взаимосвязанных нормативных документов соответствия путем исследования цитат, которые связывают положения с другими положениями в том же документе или между разными документами. При анализе юридического цитирования используется граф цитирования, извлеченный из нормативного документа, который может дополнить электронное обнаружение - процесс, который использует технологические инновации в аналитике больших данных . [18] [19] [20] [21]

История [ править ]

В статье 1965 года Дерек Дж. Де Солла Прайс описал неотъемлемую связующую характеристику SCI как «Сети научных статей». [3] Связь между цитируемыми и цитируемыми статьями стала динамичной, когда SCI начал публиковаться в Интернете. Индекс цитирования по общественным наукам стал одной из первых баз данных, которые были подключены к системе Dialog [22] в 1972 году. С появлением издания на компакт-диске связывание стало еще проще и позволило использовать библиографическую связь для поиска связанных записей. В 1973 году Генри Смолл опубликовал свою классическую работу по анализу совместного цитирования, которая стала самоорганизующейся.Система классификации, которая привела к экспериментам по кластеризации документов и, в конечном итоге, к «Атласу науки», позже названному «Обзоры исследований».

Внутренняя топологическая и графическая природа всемирной сети цитирования, которая является неотъемлемым свойством научной литературы, была описана Ральфом Гарнером ( Университет Дрекселя ) в 1965 году [23].

Использование подсчета цитирований для ранжирования журналов было методом, используемым в начале девятнадцатого века, но систематическое постоянное измерение этого подсчета для научных журналов было инициировано Юджином Гарфилдом из Института научной информации, который также стал пионером использования этого подсчета. ранжировать авторов и статьи . В знаменательной статье 1965 года он и Ирвинг Шер показали корреляцию между частотой цитирования и известностью, продемонстрировав, что лауреаты Нобелевской премии опубликовали в пять раз больше статей, а их работы цитировались в 30-50 раз больше среднего. В длинной серии эссе о Нобелевской и других премиях Гарфилд сообщил об этом явлении. Обычная суммарная мера известна как импакт-фактор.- количество цитирований журнала за предыдущие два года, разделенное на количество статей, опубликованных за эти годы. Он широко используется как для уместных, так и для несоответствующих целей - в частности, использование только этого показателя для ранжирования авторов и статей является довольно спорным.

В раннем исследовании 1964 года использования анализа цитирования при написании истории ДНК Гарфилд и Шер продемонстрировали потенциал для создания историографов , топологических карт наиболее важных этапов в истории научных тем. Позднее эта работа была автоматизирована Э. Гарфилд, А. И. Пудовкин из Института морской биологии , РАН и В. С. Истомин из Центра преподавания, обучения и технологий , Университет штата Вашингтон и привел к созданию HistCite [24] программное обеспечение около 2002 года.

Автоматическая индексация цитирования была введена в 1998 году Ли Джайлсом , Стивом Лоуренсом и Куртом Боллакером [25] и позволила автоматическое алгоритмическое извлечение и группировку цитат для любого цифрового академического и научного документа. Если раньше извлечение цитирования производилось вручную, то теперь показатели цитирования можно было масштабировать и рассчитывать для любой научной и научной области и места проведения документа, а не только для тех, которые выбираются такими организациями, как ISI. Это привело к созданию новых систем для общедоступного и автоматического индексирования цитирования, первой из которых был CiteSeer (теперь CiteSeerX , вскоре за ним последовала Cora, которая сосредоточилась в первую очередь на области информатики и науки).информатика . Позже за ними последовали крупномасштабные системы цитирования в академической сфере, такие как Google Scholar и Microsoft Academic. Такая автономная индексация цитирования еще не идеальна для извлечения цитирования или кластеризации цитирования с частотой ошибок, оцениваемой некоторыми в 10%, хотя тщательная статистическая выборка еще не проводилась. Это привело к тому, что таким авторам, как Анн-Арбор , Милтон Кейнс и Уолтон Холл , приписывают обширные научные достижения. [26] SCI утверждает, что создает автоматическую индексацию цитирования чисто программными методами. Даже более старые записи имеют такую ​​же величину ошибки.

Анализ цитирования юридических документов [ править ]

Анализ цитирования для юридических документов - это подход, облегчающий понимание и анализ взаимосвязанных нормативных документов соответствия путем изучения ссылок, которые связывают положения с другими положениями в том же документе или между разными документами. В анализе цитирования используется граф цитирования, извлеченный из нормативного документа, который может дополнить электронное обнаружение - процесс, который опирается на технологические инновации в аналитике больших данных . [20] [21] [27]

Споры [ править ]

Электронные публикации . В связи с беспрецедентным ростом доступности электронных ресурсов (электронных ресурсов) в настоящее время исследуется один из вопросов: «Как часто электронные ресурсы цитируются в моей сфере?» [28] Например, есть утверждения, что онлайн-доступ к литературе по информатике приводит к более высокому уровню цитирования, [29] однако гуманитарные статьи могут пострадать, если не будут опубликованы.

Самоцитирование . Критикуется, что авторы играют в систему, накапливая цитаты, чрезмерно цитируя себя. [30] Например, было обнаружено, что мужчины чаще называют себя, чем женщины. [31]

Цитирование Загрязнение . Из-за различных факторов, включая гонку за публикациями и рост недобросовестной деловой практики, связанной с так называемыми «хищническими» или обманывающими издателями, качество исследований в целом сталкивается с различными типами угроз. «Загрязнение цитирования» - это явление проникновения отозванных исследований или фальшивых исследований, которые цитируются в законных исследованиях, но отрицательно влияют на достоверность исследования. [32]

См. Также [ править ]

  • Показатели на уровне автора
  • Библиографическая связь
  • График цитирования
  • Влияние цитирования
  • Индекс цитирования
  • Совместное цитирование
  • Анализ близости цитирования
  • Экономика Google
  • индекс Хирша
  • Рейтинг журнала
  • Журналистика
  • Анализ основного пути
  • Декларация Сан-Франциско об оценке исследований

Заметки [ править ]

  1. ^ Рубин, Ричард (2010). Основы библиотечно-информатики (3-е изд.). Нью-Йорк: Издательство Нила-Шумана. ISBN 978-1-55570-690-6.
  2. ^ Гарфилд, E. Индексирование цитирования - его теория и применение в науке, технологиях и гуманитарных науках, Филадельфия: ISI Press, 1983.
  3. ^ a b Дерек Дж. де Солла Прайс (30 июля 1965 г.). "Сети научных статей" (PDF) . Наука . 149 (3683): ​​510–515. Bibcode : 1965Sci ... 149..510D . DOI : 10.1126 / science.149.3683.510 . PMID 14325149 .  
  4. ^ Джайлз, К. Ли; Bollacker, Kurt D .; Лоуренс, Стив (1998), «CiteSeer: автоматическая система индексации цитирования», Электронные библиотеки 98: Третья конференция ACM по электронным библиотекам, 23–26 июня 1998 г., Питтсбург, Пенсильвания , Нью-Йорк: Ассоциация вычислительной техники: 89 -98, DOI : 10,1145 / 276675,276685 , ISBN 978-0-89791-965-4, S2CID  514080
  5. ^ Примеры включают инструменты на основе подписки, основанные на частных данных, такие как Web of Science и Scopus , и бесплатные инструменты, основанные на открытых данных, такие как Scholarometer от Филиппо Менцера и его команды.
  6. ^ Каур, Джаслин; Дьеп Тхи Хоанг; Сяолин Сунь; Лино Посамай; Мохсен Джафари Асбах; Снехал Патил; Филиппо Менцер (2012). «Scholarometer: социальная основа для анализа воздействия по дисциплинам» . PLOS ONE . 7 (9): e43235. Bibcode : 2012PLoSO ... 743235K . DOI : 10.1371 / journal.pone.0043235 . PMC 3440403 . PMID 22984414 .  
  7. ^ Hoang, D .; Kaur, J .; Menczer, F. (2010), "Crowdsourcing Scholarly Data" , Proceedings of the WebSci10: Extension the Frontiers of Society On-Line, 26-27 апреля 2010 г., Роли, Северная Каролина: США , архивировано с оригинала 2015-04- 17 , дата обращения 09.08.2015
  8. ^ Андерсон, фургон MS; Роннинг, Е. А. фургон; de Vries, R .; Мартисон, Британская Колумбия (2007). «Извращенное влияние конкуренции на работу и отношения ученых». Наука и инженерная этика . 4 (13): 437–461. DOI : 10.1007 / s11948-007-9042-5 . PMID 18030595 . S2CID 2994701 .  
  9. Перейти ↑ Wesel, M. van (2016). «Оценка по цитированию: тенденции в поведении публикаций, критерии оценки и стремление к высокоэффективным публикациям» . Наука и инженерная этика . 22 (1): 199–225. DOI : 10.1007 / s11948-015-9638-0 . PMC 4750571 . PMID 25742806 .  
  10. ^ Bornmann, L .; Дэниел, HD (2008). «Что измеряет количество цитирований? Обзор исследований поведения цитирования». Журнал документации . 64 (1): 45–80. DOI : 10.1108 / 00220410810844150 . hdl : 11858 / 00-001M-0000-0013-7A94-3 .
  11. ^ Anauati, Мария Виктория и Galiani, Себастьян и Gálvez, Рамиро H. Количественный Жизненный цикл научных статей по полям экономических исследований (11 ноября 2014). Доступно на SSRN: https://ssrn.com/abstract=2523078
  12. ^ "Американское общество информационных наук и технологий" . Информационное общество в информационную эпоху . Проверено 21 мая 2006 . CS1 maint: обескураженный параметр ( ссылка )
  13. ^ Лоури, Пол Бенджамин; Муди, Грегори Д.; Гаскин, Джеймс; Галлетта, Деннис Ф .; Хамферис, Шон; Barlow, Jordan B .; и Уилсон, Дэвид В. (2013). « Оценка качества журналов и корзины журналов старших ученых Ассоциации информационных систем (AIS) с помощью библиометрических показателей: добавляют ли экспертные оценки журналов ценность? », MIS Quarterly (MISQ), vol. 37 (4), 993–1012. Также см. Видеообзор этого документа на YouTube по адресу: https://www.youtube.com/watch?v=LZQIDkA-ke0 .
  14. ^ Дин, Дуглас L; Лоури, Пол Бенджамин; и Хамферис, Шон (2011). « Профилирование исследовательской продуктивности штатных преподавателей информационных систем в учебных заведениях США », MIS Quarterly (MISQ), vol. 35 (1), стр. 1–15 ( ISSN 0276-7783 ). 
  15. ^ Каруга, Гилберт G .; Лоури, Пол Бенджамин; и Ричардсон, Вернон Дж. (2007). « Оценка воздействия ведущих исследований информационных систем с течением времени», Коммуникации Ассоциации информационных систем, т. 19 (7), стр. 115–131 (http://aisel.aisnet.org/cais/vol19/iss1/7)
  16. ^ Лю, Джон С .; Лу, Луи YY (2012-03-01). «Комплексный подход к анализу основных путей: на примере разработки индекса Хирша». Журнал Американского общества информационных наук и технологий . 63 (3): 528–542. DOI : 10.1002 / asi.21692 . ISSN 1532-2890 . 
  17. ^ Лоури, Пол Бенджамин; Каруга, Гилберт Г .; и Ричардсон, Вернон Дж. (2007). « Оценка ведущих институтов, преподавателей и статей в ведущих научных журналах по информационным системам», Коммуникации Ассоциации информационных систем, вып. 20 (16), стр. 142–203 (http://aisel.aisnet.org/cais/vol20/iss1/16).
  18. ^ Hamou-Lhadj, Абдельвахаб; Хамдака, Мохаммад (2009). «Анализ цитирования: подход к облегчению понимания и анализа нормативных документов». 2009 Шестая международная конференция по информационным технологиям: новые поколения . С. 278–283. DOI : 10.1109 / ITNG.2009.161 . ISBN 978-1-4244-3770-2. S2CID  10083351 .[ мертвая ссылка ]
  19. ^ Мохаммад Хамдака и А. Хаму-Лхадж, "Анализ цитирования: подход к облегчению понимания и анализа нормативных документов соответствия", In Proc. 6-й Международной конференции по информационным технологиям, Лас-Вегас, США
  20. ^ a b «Специальный отчет E-Discovery: восходящая волна нелинейного обзора» . Hudson Legal. Архивировано из оригинального 3 -го июля 2012 года . Проверено 1 июля 2012 года . CS1 maint: обескураженный параметр ( ссылка ) Кэт Кейси и Алехандра Перес
  21. ^ a b «Что электронное открытие с помощью технологий учит нас о роли людей в технологии - пересмотр очеловечивания с помощью технологий» . Forbes . Проверено 1 июля 2012 года . CS1 maint: обескураженный параметр ( ссылка )
  22. ^ "Диалог, бизнес Томсона" . Диалог изобрел информационные онлайн-сервисы . Проверено 21 мая 2006 . CS1 maint: обескураженный параметр ( ссылка )
  23. ^ http://www.garfield.library.upenn.edu/rgarner.pdf
  24. Юджин Гарфилд; А.И. Пудовкин; В.С. Истомин (2002). «Алгоритмическая историография, связанная с цитированием - отображение научной литературы» . Представлен ASIS & T 2002: информация, связи и сообщество. 65-е ежегодное собрание ASIST в Филадельфии, штат Пенсильвания. 18-21 ноября 2002 . Проверено 21 мая 2006 . CS1 maint: обескураженный параметр ( ссылка )
  25. ^ Джайлз К.Л., К. Боллакер, С. Лоуренс, "CiteSeer: автоматическая система индексации цитирования", Электронные библиотеки DL'98, 3-я конференция ACM по электронным библиотекам, стр. 89-98, 1998.
  26. ^ Postellon DC (март 2008). «Холл и Кейнс присоединяются к Арбор в индексах цитирования» . Природа . 452 (7185): 282. Bibcode : 2008Natur.452..282P . DOI : 10.1038 / 452282b . PMID 18354457 . 
  27. ^ Hamdaqa, M .; Хаму-Лхадж (2009). Анализ цитирования: подход к облегчению понимания и анализа нормативных документов . Лас-Вегас, Невада: IEEE. С. 278–283. DOI : 10.1109 / ITNG.2009.161 . ISBN 978-1-4244-3770-2. S2CID  10083351 .
  28. ^ Чжао, Лиза. «Как библиотекарь использовал электронные ресурсы - анализ цитирования в CCQ». Ежеквартальная каталогизация и классификация 42 (1) (2006): 117-131.
  29. ^ Лоуренс, Стив. Бесплатная онлайн-доступность существенно увеличивает влияние газеты. Том 411 (номер 6837) (2001): 521. Также на сайте http://citeseer.ist.psu.edu/online-nature01/
  30. ^ Gálvez RH (март 2017). «Оценка самоцитирования автора как механизма распространения актуальных знаний». Наукометрия . 111 (3): 1801–1812. DOI : 10.1007 / s11192-017-2330-1 . S2CID 6863843 . 
  31. ^ Сингх Чавла, Dalmeet (5 июля 2016). «Мужчины цитируют себя чаще, чем женщины» . Природа . 535 (7611): 212. DOI : 10.1038 / nature.2016.20176 . PMID 27414239 . S2CID 4395779 . Проверено 7 июля +2016 .  
  32. ^ Ван Дер Уолт, Винанд; Виллемс, Крис; Фридрих, Вернер; Хацу, Сильвестр; Кирстин, Краусс (2020). «Отозванные статьи о Covid-19 и уровни« загрязнения цитирования »: предварительный анализ и направления дальнейших исследований» . Cahiers de la Documentation - Bladen for Documentatie . 3 (4) . Проверено 13 января 2021 года .