IT 12.08.2020

Профессия Компьютерный лингвист: описание, суть, какая зарплата

9 мин.

Профессия «компьютерный лингвист»

Есть несколько основных профессий, использующихся для компьютерной лингвистики. Одна профессия – это программист. Другое дело, что обычно все программисты приходят работать недоученными, и их нужно доучивать. Но нужны и лингвисты, потому что они носители знаний о естественном языке. Лингвисты, попадая в зону компьютерной лингвистики, тоже должны получить новые знания, стать более структурными и формальными для работы в Computer science.

 «Компьютерная лингвистика предполагает сотрудничество лингвистов и программистов. И они идут друг другу навстречу. Программисты, которые занимаются компьютерной лингвистикой, поскольку они описывают объект, должны в нем разобраться. Любой программист, например, у нас (в ABBYY), понимает, что такое синтаксическое дерево, понимает, как слова связываются друг с другом, много знает о лингвистике, понимает, что такое род, число, падеж. И у нас в ABBYY в чистом виде делают специальные уровни абстракции. То есть, для лингвистов создают какие-то формальные языки, среды, внутри которых они работают, и которые приближены к их взгляду на мир.

Они приближены к языку, естественно. И лингвисты варятся в этих средах. Но при этом все равно они хорошо знают, что здесь они сейчас напишут такое-то правило. И это правило будет подхвачено таким-то алгоритмом и так-то использовано. Такие представления у лингвистов есть. Без этого они не смогли бы работать. Подготовка лингвистов с оглядкой на компьютерную лингвистику существенно влияет и на самих лингвистов. Более или менее современные лингвисты сегодня (если говорить о людях, которые занимаются естественным языком, пишут теоретические работы об этом), давно перешли на представления о компьютерных методах».

История

Компьютерная лингвистика как направление возникла в середине XX века. И первой задачей стразу стало сильно амбициозное по тем временам желание создать программу по автоматического перевода текста. При этом надо помнить, что компьютеры не отличались мощностью. И со временем люди пришли к осознанию того, насколько сложна эта задача.

Одновременно с этим было популярно направление, которое называется искусственный интеллект. Люди хотели, чтобы компьютер решал интеллектуальные задачи. Хотя искусственный интеллект – это более широкая область, чем компьютерная лингвистика, обработка естественного языка рассматривалась как его часть.

«В какой-то момент был бум методов машинного обучения. Он случился, когда люди поняли, что с помощью методов математической статистики и специальных алгоритмов можно делать так, чтобы компьютер достаточно точно воспроизводил какое-то интеллектуальное поведение человека. Могу привести пример задачи, которая по сей день очень актуальна. Это задача нахождения в текстах именованных сущностей, когда нужно найти в тексте все упоминания персон или все упоминания организаций. Оказывается, что эту задачу можно решать аналитически (писать правила, сложные алгоритмы). А можно решать эту задачу другим образом, взяв пачку текстов, разметить в ней руками, где персоны, а где организации. После этого дать ее компьютеру, сказать: «Посмотри, в этих текстах персоны здесь, а организации – здесь».

И с помощью методов научного обучения компьютер может впитать в себя это знание. И на других текстах, которые он до этого еще не видел, это повторить с довольно высокой точностью. То есть, он возьмет другой текст, которого он еще раньше не читал, и по аналогии с теми текстами угадает, где там упоминание персон, где – организаций. В этот момент он, естественно, воспользуется некоторыми признаками, которые он сам выучил. Эти признаки: большие буквы, какие-то морфологические формы. Есть разные зацепки и крючки, которые в тексте на самом деле есть. Мы читаем, понимаем, что это персона. А на самом деле персона обычно употребляется в таких-то контекстах.

 Мы даже этого не знаем. А компьютер с помощью метода машинного обучения может в себя впитать эти контексты и воспроизвести. Когда люди это поняли, возникло очень много приложений на базе машинного обучения. Методы машинного обучения сегодня очень существенная часть компьютерной лингвистики применительно к задачам анализа текстов с разных сторон. С помощью машинного обучения решается очень много разных задач».

О профессии Компьютерного лингвиста

Компьютерные лингвисты – это специалисты, занимающиеся разработкой алгоритмов распознавания текста и звучащей речи, синтезом искусственной речи, созданием систем семантического перевода и самим развитием искусственного интеллекта.

Компьютерная лингвистика предполагает создание программ, связанных с анализом языковых данных и моделированием той или иной лингвистической деятельности. Одновременно это направление требует специализированного знания о структуре языка и методах исследования

Компьютерные лингвисты – это специалисты, занимающиеся разработкой алгоритмов распознавания текста и звучащей речи, синтезом искусственной речи, созданием систем семантического перевода и самим развитием искусственного интеллекта.

Компьютерная лингвистика предполагает создание программ, связанных с анализом языковых данных и моделированием той или иной лингвистической деятельности. Одновременно это направление требует специализированного знания о структуре языка и методах исследования языкового материала.

Поскольку сегодня теоретическая лингвистика очень часто опирается на компьютерные инструменты, лингвисты, сочетающие знания в области теории языка и компьютерной лингвистики, пользуются большим спросом. Кроме того, компьютерные лингвисты востребованы как в научных учреждениях, так и в коммерческих компаниях — в том числе в компаниях Яндекс, Mail.Ru, ABBYY, Авикомп и др.

Самое большое направление в компьютерной лингвистике связано с Big Data. Ведь существуют огромные корпуса текстов типа новостных лент, из которых нужно вычленять определенную информацию — например, выделять инфоповоды или затачивать RSS под вкусы определенного пользователя.

Такие технологии есть уже cейчас и будет развиваться дальше, потому что вычислительные мощности стремительно растут. Лингвистический анализ текстов используется и при обеспечении безопасности в интернете, поиске необходимой информации для спецслужб.

Профессия «Компьютерный лингвист» на рынке труда России

По статистике популярных сайтов работы за последние 30 дней в России открыты 5 вакансий по 1 должности профессии «Компьютерный лингвист» с указанием заработной платы.

Заработная плата

Минимальная – 17 000

Максимальная – 53 300

Максимальное количество вакансий по должностям

Лингвист – 5 вакансий.

Краткое описание

Компьютерная лингвистика – это наука, которая имеет множество направлений и позволяет решить огромное количество важных задач. Компьютерные лингвисты принимают участие в создании алгоритмов и программ, используемых для извлечения данных, разработки онлайн-словарей, переводчиков, QA-систем и т. д. Например, алгоритмы распознавания естественно звучащей речи используются в системах умных домов, современных гаджетах. Такие технологии облегчают жизнь обычных пользователей и людей с ограниченными возможностями.

Драйверы профессии

  • усиление конкуренции и потребность ком­паний в детальном изучении поведения по­требителей
  • развитие семантического веба, машинного обучения, интеллектуальных систем и т. п.
  • роботизация различных видов деятельно­сти и использование «умных» устройств
  • развитие межмашинных технологий (machine-to-machine technology).

Какие задачи будет решать специалист

  • разработка алгоритмов и методов машин­ного перевода
  • решение задач извлечения информации из неструктурированных или слабоструктурированных документов
  • разработка систем человеко-машинного и межмашинного взаимодействия
  • создание систем генерации однотипных текстов по заданным параметрам (прогноза погоды, биржевых сводок и др.)
  • распознавание речи и выделение имено­ванных сущностей
  • разработка алгоритмов классификации до­кументов по заданным параметрам
  • создание вопросно-ответных систем
  • разработка систем, облегчающих коммуникацию людям с ограниченными возможно­стями.

Чем занимается компьютерный лингвист?

Может ли группа лингвистов создать новый язык?

Может и один. Такой, например, как Джон Рональд Руэл Толкин, создавший даже не один, а как минимум пару десятков языков, каждый со своей фонетикой, грамматикой и лексикой (с разной степенью детализации, разумеется). Самые известные из них, безусловно – квенья, синдарин, кхуздул и темное наречие.

Или, например, Марк Окранд, создавший и весьма детально сконструировавший клингонский язык (весьма развитый и довольно популярный и широко используемый, имеющий даже свою википедию, отдельный институт и ежеквартальный журнал). 

Ну и хрестоматийный пример – эсперанто, созданный и вовсе окулистом Лазарем Заменгофом. На данный момент число носителей языка оценивается в 1.5 – 2 миллиона человек. 

Дальше вопрос в том, насколько новый язык приживется и распространится.

Чем отличается айтишник от программиста?

Айтишник от программиста отличается не только написанием, но и описанием! IT-шник обобщенное название, а программист сфокусированное.

Более того, программист может отличается от программиста знанием языков, таких как; Java или Kotlin, SQL, XML, HTML, Visual Basic, XSL, Delphi. И чем больше программист знает языков, тем он успешней. IT-специалист, к примеру может и не знать эти языки, так как область знаний в IT обширна…

Ну остальное зависит от вашего восприятия, как и многое другое.

Лингвистика – это серьёзная наука?

Ответить на данный вопрос можно как угодно, поскольку опровергнуть это никто не сможет. У науки нет такого критерия, как серьёзность. Следовательно, ни одна наука не может быть серьёзной или несерьёзной.

Если же говорить о фундаментальности лингвистики, то она не менее фундаментальна, чем история, медицина или математика, поскольку изучает то, что сделало из обезьяны человека и позволило возникнуть человеческому обществу – язык. Без языка общения и накопления информации возникновение, развитие и существование общества невозможно. А значит лингвистика является одной из основных наук для современного человека.

Какие знания и навыки у него будут

  • знание лингвистических технологий и умение выбирать данные, необходимые для решения поставленных задач
  • знание баз данных и других источников, откуда можно получать данные
  • умение программировать прототипы и модели решений, готовить необходимые лингвистические ресурсы, проектировать процесс обработки данных и интерпретировать результаты обработки
  • умение оценивать трудоемкость разных решений, пороги допустимых ошибок и выбирать оптимальную методологию тестирования лингвистических систем.

Плюсы и минусы профессии

Плюсы

  1. Профессия интересная и новая, поэтому кадровый рынок пока испытывает дефицит компьютерных лингвистов.
  2. Специалисты, обладающие хорошей базой знаний, могут найти работу в крупнейших компаниях. В них заинтересованы Google, «Яндекс», Mail.ru Group и другие технологические холдинги.
  3. Компьютерные лингвисты – многозадачные специалисты, разбирающиеся в двух совершенно разных областях. При желании они могут сменить сферу деятельности: программирование, перевод и другие.
  4. Работа очень хорошо оплачивается.
  5. В ближайшие несколько десятков лет компьютерная лингвистика будет динамично развиваться.
  6. Работодатели оказывают компьютерным лингвистам содействие во всех вопросах, связанных с повышением квалификации, обучением.

Минусы

  1. Компьютерная лингвистика – непростая прикладная наука, для работы в рассматриваемой сфере необходима длительная подготовка.
  2. Деятельность связана с работой за компьютером, поэтому лингвисты могут страдать от ряда профессиональных заболеваний: проблемы со зрением, опорно-двигательным аппаратом и другие.

Важные личные качества

Компьютерные лингвисты объединяют в себе черты, характерные и для гуманитария, и для «технаря». Они педантичные, к работе относятся скрупулезно. Обладают логическим мышлением, многозадачностью, умением концертировать внимание, усидчивостью, склонностью к активной командной работе.

Распределение количества вакансий “Лингвист” по зарплате

2 вакансии17 000 – 23 0001 вакансия23 000 – 29 0001 вакансия29 000 – 35 0000 вакансий35 000 – 41 0001 вакансияот 41 000

Обновление данных производится каждую неделю с помощью сервиса “Яндекс Работа”. Средние значения выводятся в случае, если вакансий более 10.

Источники

  • https://habr.com/ru/company/postnauka/blog/202306/
  • https://postupi.online/professiya/kompyuternyj-lingvist/
  • https://www.profguide.io/professions/compyuterniy-lingvist.html
  • https://www.hse.ru/25professions/computer_linguist
  • https://yandex.ru/q/question/chem_zanimaetsia_kompiuternyi_lingvist_52e79b7d/?w_origin=question_control
[свернуть]
Оцените статью
Понравилась статья?
Комментарии (0)
Комментариев нет, будьте первым кто его оставит

Комментарии закрыты.