8 (800) 500-76-44
WhatsApp Задать вопрос эксперту

Лингвисты-криминалисты: пристальный взгляд на выбор слов помогает идентифицировать автора текста

Эксперты-лингвисты говорят, что основными подсказками для установления автора анонимной статьи в «Нью-Йорк Таймс», критикующей президента Дональда Трампа, могут быть не использованное в тексте необычное и запоминающееся слово «путеводная звезда», а короткие словечки - местоимения и союзы, которые люди употребляют всегда по прямому назначению: “I”(«я»), “of” («из, о, связанный с»), “but” («но»). Некоторые эксперты считают, что автор использовал слово «путеводная звезда» как отвлекающий маневр.

Чтобы установить авторов анонимных документов или возможного плагиата, эксперты используют сочетание знаний лингвистики, статистики и информатики. Именно так раскрывались преступления и тайны истории. Кто-то этот вид экспертиз называет лингвокриминалистикой, кто-то – стилометрией, а кто-то просто «установлением авторства».

После того, как неустановленный «высокопоставленный чиновник администрации» написал в «Таймс», что он (или она) был частью движения сопротивления внутри администрации президента, которое старалось обуздать самые опасные импульсивные поступки Трампа, этот вид экспертизы вдруг стал центром пристального внимания.

«Мой телефон буквально разрывался от звонков с просьбами провести экспертизу, а у меня просто не было времени», – говорит учёный в области информатики и лингвистики Патрик Юола из Университета Дюкейна.

Роберт Леонард, профессор лингвистики из Университета Хофстра, помогал в раскрытии преступлений, используя лингвистический анализ. Он говорит, что если бы эксперты могли получить нужное количество образцов текстов, написанных известными официальными лицами, то «экспертиза безусловно была бы проведена».

Один из политологов считает, что порядка 50 членов президентской администрации подходят под описание «высокопоставленный чиновник администрации», и любой из них мог бы быть автором статьи в «Таймс».

Чтобы идентифицировать автора необходимо изучить:

  • как человек пишет,
  • какие слова использует и в каком порядке,
  • насколько он грамотен в орфографии, пунктуации и грамматике.

«Все говорят по-разному. Каждый сам решает, что сказать, как сказать и когда сказать», подчеркивает Юола. «В этом смысле существует огромное количество вариантов».

Один из любимых методов Юолы и других экспертов – отслеживание так называемых «слов-функций». Это слова, которые люди все время используют, но их трудно выделять, потому что они несут не смысловую нагрузку, а функциональную. Например, это “of” («из, о, связанный с»), “with” («с»), “the” (определенный артикль), “a” (неопределенный артикль), “over” («над») и “and” («и»). «Мы все используем эти слова, но по-разному и с разной частотой, – говорит Юола. То же касается использования апострофа и пунктуации».

«Например, как вы скажете, «отличный от других» или «непохожий на других»?», – спрашивает специалист по информатике и информационным технологиям Шломо Аргамон из Технологического Университета Иллинойса. Аргамон отмечает, что женщины чаще употребляют местоимения первого и второго лица «I», «me» и «you» («я», «мне» и «ты») и настоящее время. А мужчины чаще всего используют "the" (определенный артикль), ''of" («из, о, связанный с»), ''this" («этот»), и "that" («тот»).

«Вы ищете подсказки и стараетесь оценить, насколько они полезны», – говорит Аргамон.

Однако эксперт менее оптимистичен в вопросе возможности найти автора статьи, опубликованной в «Таймс». У него есть основания для этого: во-первых, стиль статьи правили в редакции, а во-вторых, возможно были приложены усилия, чтобы обмануть экспертов-лингвистов с помощью использования различных слов, таких как, например, слово «путеводная звезда».

Ну, а основная причина пессимизма эксперта заключается в том, что для проведения достоверного анализа необходимы образцы текстов от всех возможных подозреваемых, и тексты должны быть одного жанра, например, колонка обозревателя, а не роман, эссе или журнальная статья.

Рейчел Гринстад из Дрексельского университета (Филадельфия, США) занимается изучением вопроса: в каких случаях люди стараются сбить с толку следователей, используя слова, которые они обычно не используют, либо специально делают ошибки в написании слов.

Она говорит, что вице-президент Майк Пенс несколько раз употребил в своей речи слово «путеводная звезда», и ее интуиция подсказывает, что сделал он это специально, чтобы сбить нас с толку. Уж слишком неестественным кажется использование в речи этого слова.

«Многие люди обращают внимание на особенности звучания таких слов как «путеводная звезда» вместо того, чтобы увидеть и понять всю картину в целом», – говорит Леонард из Университета Хофстра.

Гринстад считает, что лингвистический анализ мог бы «внести свой вклад» в установление авторства статьи в Таймс, по крайней мере, говорит она, «я бы его сделала».

Между тем, в обычных условиях сказанные слова несут смысловую нагрузку.

Юола давал свидетельские показания примерно в ходе 15 судебных заседания и принимал участие в расследовании еще большего количества дел, которые до суда не доходили. Самое крупное дело, в котором он участвовал, было в 2013 году.

Одной британской газете сообщили, что книгу Роберта Гелбрейта «Зов кукушки» (The Cuckoo's Calling) на самом деле написала Джоан Роулинг, автор книг о Гарри Поттере. В течение часа Юола загрузил на свой компьютер две книги Роулинг, «Зов кукушки» и еще 6 романов, провел лингвистический анализ с помощью четырех различных программ и пришел к выводу, что да, спорный роман написала Роулинг. Роулинг призналась в авторстве через пару дней.

Эта история произошла намного позже того момента, когда впервые с помощью лингвистического анализа был найден настоящий преступник. Брат Унабомбера смог определить его по характерному стилю письма*.

Пионеры лингвокриминалистики помогли поймать похитителя детей, который использовал довольно специфическое выражение, говоря о полосе травы между тротуаром и дорогой – «полоса дьявола». Это выражение употребляют в некоторых местностях Огайо.

Даже в политике, слова – как подсказки у игроков в покер. В 1996 году в романе анонимного автора «Основные цвета»** речь идет о кандидате в президенты Клинтонеску. Роман заставил Вашингтон волноваться и задуматься, кто же написал этот роман. Анализ профессора из колледжа Вассар указал на Джо Кейна, политического обозревателя из Ньюсуик. В результате, Джо признал это.

Литературные исследования отсылают нас ко времени основания Республики. Историкам стоило немалых усилий выяснить, какие из статей «Федералиста» написаны Александром Гамильтоном***, а какие – Джеймсом Мэдисоном. Окончательные выводы помог сделать в 1963 году статистический анализ. Одной из множества подсказок было использование слов "while" и "whilst" (имеют практически одинаковое значение: «в то время как, покуда, пока, несмотря на то что». прим.ред.). Мэдисон использовал "whilst", Гамильтон предпочитал "while".

Юола отмечает, что эксперты-лингвисты, анализируя текст, могут рассказать об авторе почти все: интроверт он или экстраверт, мужчина или женщина, его уровень образования, возраст, где он живет. Почти все, за исключением его знака зодиака.

«Это прекрасная наука!» – говорит Юола. «Это не анализ ДНК. Но некоторые ученые считают лингвистическую экспертизу не менее важным, следующим за ДНК-анализом, методом судебной идентификации, который даёт наиболее точные результаты».

Word Detectives: Close Look at Word Choice Could ID Writer by Seth Borenstein, Associated Press.

Перевод с английского выполнен редакцией ИСЭиК.

Примечания

* Унабомбер - террорист-одиночка, рассылавший самодельные бомбы в почтовых отправлениях людям, которых он считал ответственными за распространение технологий. В 1995 году Унабомбер (Теодор Качинский, математик) разослал в несколько печатных изданий свой манифест «Индустриальное общество и его будущее». Он был опубликован в «Нью-Йорк Таймс». Когда манифест прочитал его брат Дэвид и его жена (брат к тому времени уже не общался с Тедом), им показалось, что автор этого манифеста – Тед. Четыре месяца они сравнивали текст манифеста с имеющимися у них письмами Теда к брату. После того, как они почти убедились в причастности Теда к террористическим актам, они сообщили в ФБР с условием, что те сохранят анонимность обращения и не приговорят Теда к высшей мере наказания.

Однако произошла утечка информации, уже на следующий день стало известно общественности, кто выдал Унабомбера. Обыск жилища Унабомбера подтвердил выводы Дэвида и его жены о том, что террористом был Тед Качинский – ФБР нашли оригинал манифеста и компоненты самодельных бомб.

ФБР искало преступника 16 лет. Неизвестно, был бы ли он найден, если бы его младший брат не опознал его по тексту опубликованного в газете манифеста.

** в англ. "Primary Colors". В названии использована игра слов: «Primaries» праймериз созвучны прилагательному «Primary» основной, начальный.

*** Александр Гамильтон (11 января 1755/1757 12 июля 1804) – государственный деятель США, видный деятель Первой американской буржуазной революции (Войны за независимость США). Идеолог и руководитель Партии федералистов с момента её создания. Первый министр финансов США. Автор большинства статей сборника «Федералист» (публиковались в газетах в 1787-1788 гг.). Статьи были написаны в защиту конституции, республиканского образа правления, идеи сильного федерального правительства.

Джеймс Мэдисон (16 марта 1751 года – 28 июня 1836 года) – государственный деятель США, четвёртый президент США, один из основных авторов Конституции США и Билля о правах. Сотрудничал с Александром Гамильтоном в написании статей сборника «Федералист». Он написал 29 статей из 85.

14.09.2018 00:00:00

Бесплатная консультация


Спасибо, мы скоро свяжемся с вами.

Заказать звонок

Спасибо, мы скоро свяжемся с вами.

Важно!

Ваши вопросы просьба задавать только в режиме сообщений, для звонков используйте номер 8 (800) 500-76-44 (бесплатно по России с любых номеров)


WhatsApp Написать в Whatsapp