Jump to content

SCIgen

SCIgen
Репозиторий
Написано в Перл
Доступно в Английский
Тип Генератор бумаги
Лицензия Стандартная общественная лицензия GNU
Веб-сайт http://pdos.csail.mit.edu/scigen/

SCIgen — это генератор статей , который использует контекстно-свободную грамматику для случайной генерации бессмыслицы в виде по информатике научных статей . Его первоначальным источником данных была коллекция статей по информатике, загруженная с CiteSeer . Оформлены все элементы статей, включая графики, диаграммы и цитаты . Созданная учеными Массачусетского технологического института , ее заявленная цель — «максимизировать развлечение, а не последовательность». [1] Первоначально созданный в 2005 году для выявления недостаточной проверки материалов, представленных на конференциях, генератор впоследствии стал использоваться, в первую очередь китайскими учеными, для создания большого количества мошеннических материалов для конференций, что привело к отзыву 122 статей, созданных SCIgen, и созданию программного обеспечения для обнаружения. для борьбы с его использованием. [2]

Пример вывода

[ редактировать ]

Вступительная часть книги Rooter: Методология типичной унификации точек доступа и резервирования : [3]

Многие физики согласились бы, что, если бы не контроль перегрузок, оценка веб-браузеров, возможно, никогда бы не состоялась. Фактически, немногие хакеры во всем мире не согласятся с существенным объединением передачи голоса по IP и пары открытого/закрытого ключей. Чтобы решить эту загадку, мы подтверждаем, что SMP можно сделать стохастическим, кэшируемым и вставным.

Выдающиеся результаты

[ редактировать ]

, созданная SCIgen В 2005 году статья Rooter: A Methodology for the типичной унификации точек доступа и избыточности , была принята как нерецензируемая на Всемирной мультиконференции по системике, кибернетике и информатике (WMSCI) 2005 года, и авторы были приглашены. говорить. Авторы SCIgen описали свою мистификацию на своем сайте, и вскоре она получила широкую огласку, когда ее подхватил Slashdot . WMSCI отозвал свое приглашение, но команда SCIgen все равно поехала, арендовав место в отеле отдельно от конференции и проведя серию случайно сгенерированных докладов по своему «дорожке». Организатором конференций WMSCI является профессор Нагиб Каллаос. С 2000 по 2005 год WMSCI также спонсировался Институтом инженеров по электротехнике и электронике . [4] IEEE прекратил оказывать спонсорскую поддержку Кальяосу с 2006 по 2008 год.

Подача статьи была преднамеренной попыткой поставить в неловкое положение WMSCI, который, как утверждают авторы, принимает статьи низкого качества и рассылает ученым нежелательные запросы на представление статей. Как говорится на сайте SCIgen:

Одной из полезных целей такой программы является автоматическое создание материалов для конференций, которые, как вы подозреваете, могут иметь очень низкие стандарты подачи. Ярким примером, который вы можете узнать по спаму в вашем почтовом ящике, является SCI/IIIS и десятки проводимых рядом конференций (см. очень подробное описание конференции на веб-сайте WMSCI 2005).

О SCIgen [5]

Писатель по вычислительной технике Стэн Келли-Бутл отметил в ACM Queue , что многие предложения в статье «Rooter» были правдоподобны по отдельности, что, по его мнению, создавало проблему для автоматического обнаружения статей-мистификаций. Он предположил, что даже читатели-люди могут быть обмануты эффективным использованием жаргона («Игра слов на тему root/router является нормой для юмора выпускников Массачусетского технологического института, и по крайней мере одно упоминание методологии является обязательным») и приписал очевидную бессвязность статьи свои ограниченные знания. Его вывод заключался в том, что «надежный фильтр тарабарщины требует тщательного комплексного анализа несколькими экспертами в одной области». [6]

Змея человек

[ редактировать ]

Псевдоним практикуют «Герберт Шлангеманн» использовался для публикации фейковых научных статей на международных конференциях, которые утверждали, что рецензирование . Название взято из шведского короткометражного фильма Der Schlangemann .

  • В 2008 году в ответ на серию с запросами на бумагу электронных писем SCIgen был использован для создания фальшивой научной статьи под названием «На пути к моделированию электронной коммерции » с использованием «Герберта Шлангемана» в качестве автора. Статья была принята на Международной конференции по информатике и программной инженерии (CSSE 2008) 2008 года , спонсируемой IEEE , которая должна была состояться в Ухане, Китай , а автор был приглашен председательствовать на сессии на основании своего вымышленного творчества. Резюме . [7] Официальный комментарий обзора: «В этой статье представлены кооперативная технология и классическая коммуникация. В заключение, результат показывает, что, хотя широко разрекламированный амфибийный алгоритм для уточнения рандомизированных алгоритмов невозможен, хорошо известный алгоритм клиент-сервер для анализа передача голоса по IP Кумара и Рамана выполняется за _(n) время. Авторы могут четко определить важные особенности визуализации DHT и глубоко их проанализировать. Авторам рекомендуется более убедительно разрабатывать идеи, организовывать их более логично. и соединяет их четкими переходами». Статья некоторое время была доступна в базе данных IEEE Xplore, но затем была удалена. Вся история описана в официальном блоге «Герберта Шлангемана» , [8] и это также привлекло внимание на Slashdot [9] и немецкоязычный сайт новостей о технологиях Heise Online. [10] [11]
  • В 2009 году произошел тот же инцидент, и последняя фальшивая статья Герберта Шлангемана PlusPug: Методология улучшения локальных сетей была принята для устного доклада на Международной конференции 2009 года по электронному бизнесу и безопасности информационных систем (EBISS 2009) , также соавторствующей в 2009 году. -спонсируемый IEEE , который снова пройдет в Ухане, Китай . [8]

Во всех случаях опубликованные доклады были изъяты из сборников конференций, а оргкомитет конференции и имена основных докладчиков были удалены с их сайтов.

Список работ, получивших заметное признание

[ редактировать ]

На конференциях

[ редактировать ]
  • Роб Томас: Rooter: Методология типичной унификации точек доступа и резервирования , 2005 г. для WMSCI (см. выше)
  • Доклад Матиаса Услара был принят на конференцию IPSI-BG. [12]
  • Профессор Дженко Гулан опубликовал доклад на 3-м Международном симпозиуме по интерактивному медиа-дизайну. [13]
  • документ 2013 года Научно-метрический опубликовали не менее 85 статей SCIgen показал, что IEEE и Springer . [14] Согласно этому исследованию, более 120 статей SCIgen были удалены. [15]

В журналах

[ редактировать ]
  • Студенты иранского Технологического университета Шарифа опубликовали статью в журнале Elsevier 's Journal of Applied Mathematics and Computation . [16] Студенты писали под фамилией «Мосалла Нежад», что буквально переводится с персидского языка (несмотря на то, что это не традиционное персидское имя ) как «из вооруженной породы». Впоследствии газета была удалена, когда издателям сообщили, что это шуточная статья. [17]
  • Михаил Гельфанд опубликовал перевод статьи «Рутер» в русскоязычном «Журнале научных публикаций аспирантов и докторантов» в августе 2008 года. Гельфанд протестовал против журнала, который, видимо, не рецензировался и использовался российскими кандидатами наук для опубликоваться в « аккредитованном » научном журнале, взяв за это 4000 рублей. Через две недели аккредитация была отозвана. [18] [19] [20] [21] (Соответствующую информацию см. в «Диссернете» .)
  • Springer Science+Business Media и IEEE также стали объектом подобных розыгрышей.

Подмена Google Scholar и Хирша калькуляторов индекса

[ редактировать ]

Судейство, проводимое от имени Института инженеров по электротехнике и электронике, также подверглось критике после того, как в публикациях конференции были обнаружены фальшивые статьи, в первую очередь Лаббе и исследователем, использовавшим псевдоним Шлангеманн . [22] [23] [24] [25] [26] [27]

Сирил Лаббе из Университета Гренобля продемонстрировал уязвимость Хирша вычислений индекса на основе результатов Google Scholar , предоставив ему большой набор сгенерированных SCIgen документов, которые цитировали друг друга (по сути, академическую ферму ссылок) , в статье 2010 года. Используя этот метод, автору удалось поставить «Айка Анткара» выше, Альберта Эйнштейна . например, [28]

Отзыв 2013 г.

[ редактировать ]

отозвали более 122 опубликованных статей на конференциях, созданных SCIgen В 2013 году Springer и IEEE . В отличие от предыдущих материалов, которые были задуманы как розыгрыши, это сообщение было в основном подано китайскими учеными, которые использовали статьи SCIgen, чтобы повысить свой рейтинг публикаций. [29]

СайДетект

[ редактировать ]

выпустила SciDetect В 2015 году компания Springer . Это программное обеспечение, разработанное Сирилом Лаббе, предназначено для автоматического обнаружения документов, созданных SCIgen. [2]

отчет за 2021 год

[ редактировать ]

В 2021 году было опубликовано исследование 243 статей SCIgen, опубликованных в научной литературе. Они обнаружили, что статьи SCIgen составляют 75 на миллион статей (<   0,01%) в области информатики, и что только небольшая часть обнаруженных статей была обработана. [30] [31]

См. также

[ редактировать ]
  1. ^ SCIgen - Автоматический генератор бумаги CS
  2. ^ Jump up to: Перейти обратно: а б Боханнон, Джон (27 марта 2015 г.). «Программное обеспечение для обнаружения мистификаций обнаруживает поддельные документы» . Наука | АААС . Проверено 28 сентября 2020 г. Похоже, что многие фальшивые статьи были созданы не для розыгрыша, а из Китая, где их «покупали ученые и студенты», чтобы пополнить свои записи о публикациях, говорит ведущий исследователь расследования Сирил Лаббе, ученый-компьютерщик из Университет Жозефа Фурье в Гренобле, Франция.
  3. ^ Стриблинг, Джереми; Агуайо, Дэниел; Крон, Максвелл. «Rooter: методология типичной унификации точек доступа и резервирования» (PDF) .
  4. ^ Генрих Занкль: Генератор науки — гениальная программа публикаций . В. Хёмберг, Э. Ролофф (редактор): Ежегодник маржиналистики IV: Лит-Верлаг. Мюнстер. 2016, стр. 60–67. ISBN   978-3-643-99793-7
  5. ^ «SCIgen — автоматический генератор CS-бумаги» . Массачусетский технологический институт.
  6. ^ Стэн Келли-Бутл (июль – август 2005 г.). «Назовите это тарабарщиной?» . Очередь АКМ . 3 (6): 64. дои : 10.1145/1080862.1080884 .
  7. ^ «Программа конференции CSSE» (PDF) .
  8. ^ Jump up to: Перейти обратно: а б «Официальный блог Герберта Шлангемана, вся история статьи «К моделированию электронной коммерции» » .
  9. ^ Кдоусон (24 декабря 2008 г.). «Работа, созданная программным обеспечением, принята на конференции IEEE» . Слэшдот . VA Linux Systems Япония . Проверено 5 мая 2009 г.
  10. ^ Питер-Майкл Зиглер (26 декабря 2008 г.). «Доктор Герберт Снакеманн - или история псевдонаучной бессмысленной статьи (на немецком языке)» . Хейзе онлайн . Издательство журнала Heise . Проверено 5 мая 2009 г.
  11. ^ Веб-страница Heise Online (на немецком языке)
  12. ^ «Доклад Матиаса Услара» . Архивировано из оригинала 15 июня 2009 г.
  13. ^ «О статье Генко Гулана» .
  14. ^ «Дубликаты и фейковые публикации в научной литературе: сколько статей SCIgen по информатике?» (PDF) . Hal.archives-ouvertes.fr . Проверено 15 мая 2014 г.
  15. ^ «Издатели отзывают более 120 тарабарщин» . Природа . 24 февраля 2014 года . Проверено 25 февраля 2014 г.
  16. ^ Рохолла Мосаллахнежад. «Кооперативные компактные алгоритмы для рандомизированных алгоритмов» (PDF) . Архивировано из оригинала (PDF) 29 декабря 2009 г.
  17. ^ Рохолла Мосаллахнежад (2007), «УДАЛЕНО: Кооперативные компактные алгоритмы для рандомизированных алгоритмов», Прикладная математика и вычисления , doi : 10.1016/j.amc.2007.03.011
  18. ^ «Мой компьютер пишет лучше твоего!» . Agence Science-Presse (на французском языке). Канада. 8 сентября 2009 года . Проверено 4 октября 2011 г.
  19. ^ «Рутер вторгается в Россию» . SCIген . 8 января 2009 года . Проверено 4 октября 2011 г.
  20. ^ Малоземов, Сергей (7 октября 2008 г.). Группа отечественных ученых поставила эксперимент — смешала сложные термины случайным образом, а полученный текст отослала в один из научных журналов . НТВ (на русском языке) . Проверено 4 октября 2011 г.
  21. ^ "Обратная связь". Новый учёный . 15 августа 2009 г.
  22. ^ Лаббе, Сирил; Лаббе, Доминик (2013). «Дубликаты и фейковые публикации в научной литературе: сколько статей SCIgen по информатике?» . Наукометрия . 94 (1): 379–396. дои : 10.1007/s11192-012-0781-y . S2CID   6889400 .
  23. ^ Оранский Иван (24 февраля 2014 г.). «Спрингер, IEEE отзывает более 120 бессмысленных статей» . retractionwatch.com . WordPress.com . Проверено 29 апреля 2014 г.
  24. ^ де Глостер, Пол Колин (2013). «Рецензенты часто упускают из виду очевидные ошибки в компьютерных и электронных публикациях» . Подотчетность в исследованиях: политика и обеспечение качества . 20 (3): 143–166. Бибкод : 2013ARPQ...20..143D . дои : 10.1080/08989621.2013.788379 . ПМИД   23672521 . S2CID   42975675 .
  25. ^ Доусон, К. (23 декабря 2008 г.). «Работа, созданная программным обеспечением, принята на конференции IEEE» . slashdot.org . Кости . Проверено 29 апреля 2014 г.
  26. ^ 24 декабря 2008 г.). IEEE принимает автоматически созданный . » фальшивый Хатта, Масаюки ( документ « Конференция
  27. ^ Зиглер, Питер-Майкл (26 декабря 2008 г.). «Доктор Герберт Снейкманн – или история псевдонаучной бессмысленной статьи» . heise.de (на немецком языке). Издательство журнала Heise . Проверено 29 апреля 2014 г.
  28. ^ «Отчеты об исследованиях LIG» (PDF) . Rr.liglab.fr . Проверено 15 мая 2014 г.
  29. ^ Ван Ноорден, Ричард (2014). «Издатели отзывают более 120 тарабарщин» . Новости природы . дои : 10.1038/nature.2014.14763 .
  30. ^ Кабанак, Гийом; Лаббе, Сирил (25 мая 2021 г.). «Распространенность бессмысленных алгоритмически сгенерированных статей в научной литературе» . Журнал Ассоциации информационных наук и технологий . 72 (12): 1461–1476. дои : 10.1002/asi.24495 . ISSN   2330-1635 . S2CID   236374033 .
  31. ^ Ноорден, Ричард Ван (27 мая 2021 г.). «В научной литературе до сих пор скрываются сотни бессмысленных статей» . Природа . 594 (7862): 160–161. Бибкод : 2021Природа.594..160В . дои : 10.1038/d41586-021-01436-7 . ПМИД   34045760 . S2CID   235232305 .

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 25d896e26d0acd84a4011d2b57dac3b5__1686327960
URL1:https://arc.ask3.ru/arc/aa/25/b5/25d896e26d0acd84a4011d2b57dac3b5.html
Заголовок, (Title) документа по адресу, URL1:
SCIgen - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)