Как Брукс хотел быть писателем
Александр Брукс недовольно поморщился, глядя на сообщения в форуме. Его новый рассказ, который он подал на конкурс, разнесли под корень. Особенно Брукса задел кусочек комментария, где компьютерная программа подсветила повторяющиеся слова. Ему показалось странным, что литераторы пользуются его же оружием (Брукс был программистом), чтобы расковыривать художественные произведения. Это нечестно.
Брукс гневно сжимал кулаки, глядя в монитор и ёрзая на неудобном старом деревянном стуле. Возможно, на этом всё бы и закончилось, если бы на заднем фоне в это время по спутниковому каналу не шла документальная передача. Телевизор показывал американскую игру-викторину “Jeopardy!”, чем-то похожую на российскую «Свою игру». Ведущий задавал вопросы, игроки нажимали на кнопки, стараясь быстрее дать правильный ответ. Необычным было то, что вместе с людьми на этот раз играл компьютер. Голос за кадром объяснял, что суперкомпьютер фирмы IBM «Уотсон» победил лучших игроков за всю историю “Jeopardy!”.
Александр повернулся к экрану. Как специалист он быстро оценил уровень достижения. Чтобы правильно отвечать на вопросы, компьютер должен был уметь понимать аналогии, метафоры и другие причуды человеческого языка. «Забавно», — подумал Брукс, вновь посмотрев на экран монитора. Если технология сегодня может так много, почему не написать программу, которая почистит стиль рассказа? Заменит повторы слов на, подходящие по контексту, синонимы, уберёт ляпы, несогласованности и прочее?
Если бы Брукс не был так раздражен, ему бы в голову не пришло взяться за подобный проект. Но обстоятельства сложились таким образом, что Александр начал работу, а будучи человеком упрямым, он привык доводить свои идеи до реализации.
Сначала он написал простую программу замены повторяющихся слов на синонимы по словарю. Результат его разочаровал:
«Винд забывчиво осмотрелась вокруг. Номер один вокзал был шумным местом — до сих пор вокруг сновали тама-сюда, проверяли домашние билеты, тащили много-то тяжелые сумки и настороженно прислушивались к объявлениям поездов. Идеже-то в этой безымянной толпе пассажиров бродили личный состав без цели, билетов, багажа — тетя, кто не нуждался в расписании. Местные жильцы, которым уже не к чему ждать, поскольку они пропустили колонна своей жизни и навек застряли нате одном месте. Сии жители вокзала навсегда находились здесь, пытаясь пропасть среди потока пассажиров».
«Какая чушь», — подумал Брукс. «Конечно чушь», — ответил его внутренний голос. «Неужели ты думал, что будет так вот просто?». «Нет», — согласился Брукс со своим внутренним голосом. «Надо лучше изучить вопрос». За изучением вопроса Александр обратился к Гуглу и вскоре нашел статьи про латентный семантический анализ, глубинное машинное обучение и нейронные сети. Тексты изобиловали сложными формулами, но он упорно продирался сквозь них, мечтая о славе великого писателя.
***
Прошло три года. Сидя на кожаном кресле в своём кабинете, Брукс снова был недоволен. Его не успокаивал тот факт, что основанная им фирма “LanguageAWare” росла, как на дрожжах. Грамотная замена слов синонимами и стилистические преобразования оказались востребованными задачами для продвижения сайтов в Интернете. Но Бруксу хотелось стать писателем. И Хотя его рассказ, благодаря программе, которую он назвал «Дженн», прошёл-таки предварительный отбор, после голосования творение Александра заняло тридцать восьмое место из сорока. Несмотря на то, что последняя версия программы могла распознавать и исправлять логические ошибки, например, заменяя фразу «Часы висели над головой сверху» на «Часы висели над головой» с указанием, что «над головой» подразумевает «сверху».
В дверь постучали и, не смотря на предупреждение секретарши «Шеф сегодня не в настроении», вошёл помощник Брукса, Николай Гафт.
— Мне можно? — спросил он.
Брукс кивнул, и вопрошающе посмотрел на вошедшего.
— Есть несколько вопросов, — сказал Гафт, листая блокнот. — Союз критиков выступает против применения нашей программы в художественной литературе. Известный критик Яковленский заявил, что она создает «нечеловечески гладкий текст и до невозможности отполированный стиль».
— Значит, раньше им не нравилось, что тексты кривые и стиль хромает, а теперь «слишком гладко»? — раздраженно спросил Брукс. — Сами то они знают, чего хотят? Вот что, устройте показательную демонстрацию. Пригласите критиков, дайте им текст, отредактированный человеком и программой. Предложите отличить один от другого. Они не смогут, и мы напечатаем опровержение этому Яковленскому.
— Но, а если наша программа действительно работает слишком хорошо? — в голосе Гафта звучала неуверенность.
— Слишком не бывает! — заявил Брукс. — Просто эти критиканы выучились распознавать работу нашей проги. Сделайте так, что система будет делать случайные ошибки, раз на 200 слов. И дело в шляпе. Не беспокойте меня больше ерундой. Что-нибудь важное есть?
— Отчет за четвертый квартал говорит о снижении роста доходов и увеличение доли конкурентов на рынке, — произнёс Николай. Эксперты рекомендуют нам осваивать новые ниши, так как автоматический корректор давно уже не новость.
— Не новость, — проворчал Брукс, глядя на монитор. А давайте-ка Николай, пусть фирма выпустит автоматического критика. А то всякие там конкурсы, редакторы, рецензенты, как их там… Столько денег и сил зря. Сделайте прогу: на входе текст, на выходе оценка. И всё.
— Как вы себе это представляете? — удивлённо спросил Гафт.
— Не мне вам объяснять, как работает машинный классификатор. Это же давно решённая проблема. Берем статистические характеристики текста, и оценки человека на входе, и тренируем классификационный алгоритм: нейронную сеть или машину поддерживающих векторов. Отзывы на товары уже давно классифицируют как положительные или отрицательные. Новости на интересные и не очень. А мы будем классифицировать художественные произведения.
— Но это же литература! — воскликнул Гафт. — Нельзя оценивать рассказ или роман по статистическим характеристикам! Там же есть смысл.
— О, вы так думаете? — насмешливым тоном поинтересовался Брукс. — Взгляните сюда.
Брукс загрузил рассказы с сайта литературного конкурса вместе с проставленными оценками и быстро составил в текстовом редакторе «блокнот» программу-классификатор, подключив стандартные библиотеки и данные стилистического корректора. Собрав исполняемый файл из командной строки Линукса, он запустил полученное творение. На экране замелькали уменьшающиеся значения стандартной ошибки.
— Ну вот, — удовлетворенно сказал Александр, когда программа выдала блок окончательных результатов. Точность — 76%, F1 — 73%. При том, что между людьми согласие существует только на 80%. Значит доля вашего «смысла» в оценке не больше семи процентов. А скорее всего меньше, так как я ничего не сделал, по сути. Грамотный подбор характеристик позволит улучшить показатель. Отныне издательства не будут тратить деньги на зарплаты критикам, и ни один гениальный писатель не окажется забытым!
— Но… — несколько секунд Николай стоял с открытым ртом глядя на экран. —Тогда ваша программа по статистическим характеристикам сама сможет писать рассказы.
— Нет, — несколько разочарованно сказал Брукс. Какой-то смысл всё-таки должен быть, чушегенератор его не сможет вложить... пока не сможет. Мы просто показали, что не имеет значения какой именно смысл в произведении. Глубокий, поверхностный, новый, старый — не важно.
— А вам не кажется, что мы будем с одной стороны выпускать продукт, который улучшает стиль, меняя стат-характеристики, а с другой собираемся по ним оценивать качество?
— Мда... что-то здесь не то, — Александр почесал рукой затылок. — Да, бог с ним, какая разница. Делайте.
***
Прошло еще пять лет. Наверху небоскреба штаб-квартиры «LanguageAWare Inc» апартаменты Брукса занимали половину этажа. Здесь был не только рабочий кабинет, но и библиотека со старинными печатными книгами, комната отдыха и даже сауна.
— Есть сегодня важные встречи? — спросил он вслух.
— Нет, господин Директор, — произнёс приятный женский голос Дженн.
— Слава Богу! — Брукс до сих пор не мог нарадоваться тому моменту, когда смог уволить живую секретаршу и приспособить для этой цели программу. Автоматический классификатор важных дел не позволял беспокоить его по всякой ерунде.
— Хорошо… Можно расслабиться, — с наслаждением сказал Александр. Дженн, найди-ка мне хорошую книгу почитать.
Дженн выбрала текст из базы данных и послала его на мобильный ридер директора.
Брукс с удобством расположился в кресле-качалке и начал читать. В начале произведения указывались обязательные параметры «Индекс общей читабельности — 95%, коэффициент стиля — 86%, доля ошибок — 0.4%, средневзвешенная увлекательность — 67%». Через десять минут Брукс с раздражением отложил ридер.
— Какая чушь! Ненавижу современную литературу! Дженн, найди мне что-нибудь старое, Азимова, например.
— Выполнено, господин Директор.
Александр открыл текст и удивленно обнаружил вначале такой же список параметров читабельности. Пролистав несколько страниц, он нахмурился, затем прошёл в библиотеку, снял с полки печатный том и начал сравнивать.
— Дженн, вызови моего заместителя сюда!
Через десять минут Брукс разъяренно предъявил озадаченному Гафту текст.
— Что это такое, я вас спрашиваю!
— Это улучшенное издание Азимова со стиль-корректором и логик-корректором, — оправдывался тот. — Очень популярно сейчас, переиздание старых книг. Знаете как фильмы в формате 3D.
— Кошмар. Куда катится мир! — горестно воскликнул Александр. — Мало того, что современные авторы пишут глупости, мы ещё старых переделываем.
— Ну, вы же сами этого добились, Брукс, когда предложили программу-рецензента. — пожал плечами Николай. Вы создали этот мир, где правят машины.
— Нет! — громко сказал тот, погрозив указательным пальцем. — Я бы не смог этого сделать с алгоритмами десятилетней давности, я бы никогда не добился результата, если бы люди смотрели на смысл, вникали в тексты. Я смоделировал поверхность, и всем это понравилось. Если бы люди уважали содержание, а не форму, то я бы прогорел!
Внезапно Брукс поник и тяжело опустился в кресло.
— Не дай бог, ваши программы начнут и классиков переписывать.
— Эээ… Вообще-то это в планах фирмы. Золотая коллекция русской литературы в редакции самых лучших алгоритмов. Толстой, Достоевский, Гоголь…
— Ужас… ужас. Представляю Достоевский в современном стиле. Покажите-ка мне.
Гафт ввёл код, и на ридере Брукса появилась последняя редакция «Преступления и наказания». Текст уложился в один абзац.
«Старуха-процентщица была доброй и всегда помогала бедным голодным студентам в трудной ситуации. Те не оставались в долгу и тоже заботливо относились к ней. Конец».
— Боже, что за чушь! Как это получилось? Объясните! — воскликнул Брукс.
— Хммм… Я не знаю….
— А кто знает??? — Брукс подошёл к Гафту и начал трясти его. — Кто будет за это отвечать?!
— Позвольте, я объясню, — раздался спокойный приятный голос Дженн.
Оба мужчины удивленно обернулись.
— Дело в том, — продолжал голос, — что произведение базируется на логической ошибке. Оно рисует неблагожелательное отношение бизнес-вумен к своим клиентам, что минимизирует ожидаемую прибыль. Кроме того, оно базируется на идее борьбы людей между собой, что также не логично, и не соответствует главной задаче интеллекта — максимизации ожидаемой выгоды. Исправление этих существенных ошибок автора позволило значительно сократить текст в объеме без потери качества.
— Так, — сказал Александр, едва обретя равновесие. — Завтра же, Гафт, я жду вас с предложениями по новой линии продукции фирмы.
— Какой линии?
— Разумеется, автоматический бизнес-консультант, и автоматический консультант политика. Мы всё-таки сделаем мир лучше! — с горящими глазами воскликнул Брукс.
Оценка произведения:
Индекс читабельности — 70%;
Уровень грамотности автора — 20%;
Композиция — 16%;
Число повторов на 120 слов: 8.41;
Не рекомендуется к прочтению.
Дженн