Курс рубля
- Режим свободного падения: что ждет рубль в 2024 году
- Что будет с долларом: бежать в обменники сломя голову рано
- Предсказано мощное падение доллара по двум причинам
Отдел современных информационных технологий, входящий в состав управления науки и техники Центрального разведывательного управления США, продемонстрировал общественности технологии "извлечения данных" ("data mining"), используемые для поиска значимой информации среди огромного количества страниц документов и в радио- и телепередачах на различных языках, сообщила Yahoo! News.
Поиск ведется как по систематизированным, так и по случайным источникам, причем объектами поиска являются тексты в печатных изданиях и в цифровом виде, графические изображения, аудиоинформация на 35-ти языках. Для отсеивания аудиоинформации используется методика "Oasis", которая распознает речь и превращает ее в текст. При этом технология позволяет отделять мужские голоса от женских, а также голоса, принадлежащие разным людям, и записывать их в виде диалогов.
Методика "Oasis" позволяет выделять из аудиопотока только те голоса или ту конкретную информацию, которая заложена в настройках поиска. Пока существует только англоязычная версия "Oasis", но ЦРУ планирует вскоре создать версии на китайском, арабском и других языках, а также усовершенствовать программу, чтобы она смогла распознавать не только отдельные слова, но и их синонимы и синонимические словосочетания.
Другая компьютерная технология под названием "FLUENT" позволяет искать информацию в текстовых документах. Эта технология подразумевает поиск по ключевым словам, причем вводится слово или сочетание на английском языке, которое тут же переводится на целый ряд других языков, и найденная информация из базы данных на разных языках поступает исследователю после автоматического перевода.
FLUENT может переводить на английский с китайского, корейского, португальского, русского, сербско-хорватского, украинского и других языков.
Еще одна программа, Text Data Mining, позволяет автоматически создавать предметные указатели для текстовых документов, а также получать данные по частоте употребления тех или иных слов в документах.
Все эти технологии ЦРУ уже использует в отслеживании незаконных финансовых операций и наркотрафика.
Ситуация грозит полностью выйти из-под контроля
Политик надеялся, что сможет перетянуть страну на свою сторону