Анализ звучащей речи

Praat download >
Freeware:
Praat (doing phonetics by computer) - компьютерная программа, разработанная в институте фонетических исследований Амстердамского университета, Нидерланды, профессором Полом Боерсма и Дэвидом Вининком в 2009 году.
Praat позволяет анализировать, синтезировать речь и управлять ею, а также создавать высококачественные иллюстрации для Ваших статей и тезисов. Обрабатывает аудиофайлы в формате WAV, AIFF, FLAC и др. Русскоязычный интерфейс отсутствует.
Функциональные возможности:

1. Спектральный анализ:
  • акустическая характеристика (частота, мощность звука, формат);
  • возможность редактирования звуковых сегментов;
  • возможность распечатать спектограмму.
2. Анализ тона:
  • анализ форманты (акустический показатель в распознавании речи);
  • анализ мощности звука;
  • аннотирование (спектограмма, тональный контур, контур форманты, мощность).

Speech Tools download >
Freeware:
Программы для фонетического и фонологического анализа (Phonology Assistant
IPA Help, Speech Analyzer).
Вы можете использовать Speech Analyzer:
  • Для выявления основной частоты, спектрального анализа и продолжительности измерений.
  • Анализа музыкальных записей.
  • Замедлять воспроизведения, повторять композиции с целью оказания помощи в восприятии и мимики для изучения языка.
  • Программа Phonology Assistant отслеживает фонетические данные с клавиатуры и из речи записи анализатора звука. Она использует стандартные символы IPA для индексации и отображения данных.

Audacity download >
Freeware:
Audacity – это цифровая аудио-студия (digital audio studio), то есть программа, в которой можно микшировать звуковые дорожки, обрабатывать их эффектами и редактировать звуковой материал.
Программа распространяется свободно, занимает 4 КБ,имеет достаточно простой интерфейс и доступна для всех наиболее распространенных операционных систем. Кроме этого, в ней есть возможность редактировать звуковую дорожку. Рассчитывать на высокое качество записи не придется, однако этот вариант вполне приемлем для пробы сил и анализа своих возможностей.

WaveSurfer download >
Freeware:
WaveSurferэто инструмент с открытым исходным кодом, предназначенный для визуализации звука и различных манипуляций. Программа была разработана, чтобы удовлетворить потребностям как новичкам, так и продвинутым пользователям.
WaveSurfer имеет простой и логичный пользовательский интерфейс, который обеспечивает функциональность в интуитивно понятным способом, и которые могут быть адаптированы к различным задачам. Он может быть использован в качестве автономного инструмента для широкого круга задач в исследовании слова и образования. Типичные области применения речи / обоснованного анализа и звука аннотации / транскрипции.
WaveSurfer также может служить платформой для более продвинутых и специализированных приложений. Это достигается либо путем расширения сферы применения WaveSurfer с новых пользовательских плагинов или путем встраивания компонентов WaveSurfer визуализации в других приложениях.

PCquirerX и MacquirerX download >
Shareware:
Macquirer – Мощная и простая в использовании система анализа речи.
С помощью нее можно записовать, редактировать и анализировать звуковые сигналы одним нажатием кнопки. Частота, усиление, фильтр скорости контролируется программным обеспечением. Программа анализирует спектрограммы, интенсивность, высоту звука.

GoldWave download >
Shareware:
GoldWave – это профессиональный цифровой аудио редактор.Он полностью нацелен сделать все, от простейших записей до редактирования самых сложных обработок звука, восстановления, улучшения и преобразования. Он прост в освоении и использовании.
Особенности программы включают в себя огромное редактирования файла (4 ГБ и за ее пределами на NTFS-отформатированных дисков), высокое качество файлов (24 бит, 192 кГц), в режиме реального времени изображения (бар, волны, спектрограммы, спектр, измеритель уровня шума), уменьшение шума, экспрессивная оценка и многое другое.
На сайте можно скачать бесплатную (ознакомительную) полнофункциональную версию.

Adobe Audition download >
Shareware:
Ранее известная как CoolEditPro.
Adobe Audition имеет целый ряд функциональных возможностей. Вы можете перемещать громкость, панораму, эффекты; вы можете слушать и записывать изменения в миксе в реальном времени, в режиме реального времени есть входной контроль.
Продукция высокого разрешения, 24 - или 32-разрядные файлы с частотой дискретизации до 192 кГц для аудио и HD-DVD-качества.
Создайте настроенный набор команд, скриптов и эффектов, которые легко доступны через меню Существует избранный или назначаемый набор сочетаний клавиш.
При помощи программы, легко восстановить записи из старых виниловых пластинок, удалить микрофонный треск, шипение, шумы, исправление обрезанных аудио, шумоподавление, и многое другое.

Transana download >
Shareware:
Transana – инструмент для профессиональных исследователей, которые хотят разложить цифровое видео или аудиоданные. Transana позволяет вам анализировать и управлять своими данными очень сложными способами.
Запишите, идентифицируйте аналитически интересные клипы, присвойте ключевые слова клипам, расположите и перестройте клипы, создайте комплексные наборы взаимосвязанных клипов, зондируйте отношения между примененными ключевыми словами, и совместно используйте ваш анализ с коллегами.
Transana - это новый способ сосредоточиться на ваших данных, и новый способ управления большим количеством видеофайлов , аудиофайлов и клипов.
Особенности устройства:
  • Запишите видеофайлы или аудиофайлы.
  • Идентифицируйте и легко получите доступ к аналитически существенным частям видеоданных.
  • Управляйте большими телевизионными наборами, содержащими сотни (и потенциально тысячи) часов видео.
  • Организуйте видеоклипы в значимые категории, как механизм для разработки и расширения теоретического понимания того, что показывает видео.
  • Примените доступные для поиска аналитические ключевые слова к этим видеоклипам.
  • Просмотрите графические и основанные на тексте отчеты о своем аналитическом кодировании.
  • Участвуйте в комплексном анализе данных и тестировании гипотезы через большие телевизионные наборы.
  • Совместно используйте аналитическую разметку с удаленными коллегами, чтобы облегчить совместный анализ.

Amadeus Pro download >
Commercial:
Представляет собой очень мощный звуковой редактор для поддержки различных форматов, включая MP3, AAC, Ogg Vorbis, Apple Lossless, AIFF, Wave и многих других. Он работает на MacOS 9.2, а также изначально работал на MacOS X.
Другие особенности включают импорт / экспорт данных, возможность для разделения и объединения файлов вместе, и в режиме реального времени спектрального анализа и осциллографа.

Transcriber download > http://www.transcriber.ru/rus/index_rus.htm
http://trans.sourceforge.net/en/presentation.php
Freeware:
Transcriber – это компактная и простая в использовании программа для аннотирования звука и видео. Позволяет создавать несколько ярусов аннотаций, например для нескольких говорящих.

ELAN download >
Freeware:
ELAN – инструмент для аннотирования, позволяющий создавать, редактировать, визуализировать и осуществлять поиск аннотаций для видео и аудио данных.
ELAN специально разработан для анализа естественного языка и языка жестов, но он может быть использован всеми, кто работает с медиа - корпусом, т.е. с видео и / или аудио данными с целью аннотирования, анализа и документирования.
С помощью ELAN пользователь может добавлять неограниченное количество аннотаций к аудио и/или видео файлам. Аннотацией может быть предложение, слово или толкование, комментарий, перевод или описание любой характеристики, наблюдаемой в аудиовизуальной среде. Аннотирование можно создавать на нескольких слоях, называемых tiers (ярусы). Ярусы могут быть иерархично соединены. Аннотирование может быть выполнено либо в соответствии с распределением времени согласно медиа источника, либо со ссылкой на другие уже существующие аннотации.
ELAN совместим с ОС Windows, Mac OS X и Linux.
Начиная с версии 4.3.0, выпущенной 10 апреля 2012 года, имеется русскоязычный интерфейс.
Все рекомендации по использованию ELAN (на английском языке), Вы можете найти в разделе Documentation, перейдя по ссылке: http://www.lat-mpi.eu/tools/elan

EXMARaLDA download >
Freeware:
EXMARaLDA - бесплатная система концептов, информационных форматов и инструментов, предназначенная для компьютерного транскрибирования и аннотации разговорного языка, а также для построения корпуса разговорного языка. Данная программа была разработана в рамках проекта "Компьютерные методы для создания и анализа многоязычных данных" в Совместном научно - исследовательском центре "Multilingualism" Гамбургского университета. С июля 2011 года дальнейшим развитием EXMARaLDA занимается Гамбургский центр языкового корпуса.
Русскоязычный интерфейс отсутствует. В состав данной программы входят четыре программных средства:
Инструкции (на английском и немецком языках) по использованию всех выше указанных программных средств Вы можете найти, перейдя по ссылке: http://www.exmaralda.org/en_hilfe.html

SignStream download >
Commercial:
SignStream – это инструмент для анализа языковых данных, полученных из видео. SignStream разработан специально для работы с данными из американского языка жестов, но этот инструмент может быть применен к любому языку данных, полученных из видео.
SignStream предоставляет единую среду для работы с цифровым видео и связывания последовательностей кадров, одновременно, с происходящими языковыми событиями, которые закодированы в мелкозернистые многоуровневые транскрипции.
Предоставляя усовершенствованные возможности поиска, SignStream предоставляет мгновенный доступ к данным. Кроме того, многочисленные высказывания могут быть открыты одновременно, что позволяет одновременное сравнение данных в них.

IBM VideoAnnEx Annotation Tool download >
Freeware:
IBM VideoAnnEx Annotation Tool – это инструмент для аннотирования видеофрагментов mpeg и mpeg2. Каждый кадр в видео может быть нанесен со статическими описаниями сцены, ключевыми описаниями объекта, описаниями событий, а также другим набором лексики. Аннотированные описания хранятся в XML файле.

WinPitchPro download >
Shareware:
WinPitchPro – это инструмент для создания мультимодальной транскрипции и выравнивания программного обеспечения, со встроенным акустическим анализом (спектрограммы, фундаментальные отслеживания частоты, интенсивности) и повторного синтеза (просодический морфинг).
Достоинства программы:
Переменная скорость воспроизведения, выравнивание текста в речи. XML и Excel продукция, полностью совместима с Unicode

http://www.noldus.com/human-behavior-research/products/the-observer-xt
http://www.icg.tugraz.at/opportunities/actionFeatures/detection-and-analysis-of-human-behavior-in-natural-environments
http://human-behavior.software.informer.com/
Анализ письменной речи

Wordcorr download >
Freeware:
Wordcorr – это новый инструмент для исследования и преподавания в сравнительной лингвистике, в настоящее время в производстве версия 2.0 для Windows 98/2000/XP.
Wordcorr автоматизирует утомительные процессы подведения итогов и управления звуковыми соответствиями, используемые в разработке исторического развития естественных языков. Данные могут быть введены с клавиатуры и отредактированы в полном Unicode. Электронные таблицы, WordSurv и Palmsurv, они опираются на экспорт внутренней базы данных Wordcorr в том числе анализы XML-файлов.

SIL FieldWorks (beta version) download >
Freeware:
FieldWorks – это ряд программных инструментов, которые управляют культурными и лингвистическими данными от начального набора собранных данных, до подготовки данных для публикации:
Выборка того, что поддерживает FieldWorks:
  • процесс разработки Словаря, который определяет подход для создания и совершенствования словаря;
  • категоризация культурных наблюдений;
  • комплексные неримские сценарии, используется Unicode и разработанный SIL-Графит;
  • большинство систем письменности (кроме вертикального сценария).

Lexique Pro download >
Freeware:
Lexique Pro – представляет собой интерактивный словарь.
Словарь может быть сконфигурирован для отображения панели инструментов, в удобном для пользователя формате.
Программа читает данные из базы данных. Лексические статьи выводятся с левой стороны экрана в сортированном списке. На домашней странице, списки слов могут быть выбраны, щелкая по соответствующим буквам алфавита. Можно переместиться вокруг своего словаря, щелкая по гиперссылкам.
Lexique Pro создает гиперссылки к связанным записям, таким как синонимы, морфемы, основные записи, перекрестные ссылки и промежуточные штреки. Можно включать одно или более изображение для каждой записи словаря. Поддерживаемые форматы изображения: JPG, PNG, GIF, BMP.
http://ru.scribd.com/doc/23384517/Lexique-Pro - руководство по работе с программой (англ.яз)

http://lxln.prettydata.eu/Default.aspx
http://lxln.prettydata.eu/Login.aspx

http://deb.fi.muni.cz/index.php
http://dictionary-system.hvalur.org/index.php?lang=en
http://download.travlang.com//
http://glossword.biz/
http://linguistica.uchicago.edu/linguistica.html
http://tshwanedje.com/tshwanelex/
http://wesay.palaso.org/
http://wordnet.princeton.edu/
http://www.abbyy.ru/lingvo-content/
http://www.altova.com/metateam.html
http://www.celta.paris-sorbonne.fr/anasem/indexIL.html
http://www.emp.dk/ilexweb/index.jsp
http://www.idm.fr/products/dictionary_writing_system_dps/27/
http://www.ims.uni-stuttgart.de/projekte/TIGER/TIGERSearch/oldindex.shtml
http://www.lexically.net/wordsmith/
http://www.sil.org/computing/toolbox/
http://www.termbases.eu/
http://www.the-smartdoccer.com/home/en/home.htm

http://ablemedia.com/ctcweb/showcase/roots.html
http://billposer.org/Software/msort.html
http://eelex.eki.ee/
http://hfst.sourceforge.net/
http://marcion.sourceforge.net/
http://nlp-sanchay.sourceforge.net/
http://www.lexique.org/
http://www.otsistemas.com/eiffel.php
http://www2.ling.su.se/fon/IPA-tecken.htm

анализ почерка:
http://aac-rerc.psu.edu/wordpressmu/RESNA-SDC/2010/05/13/handwriting-analysis-software/
http://atwiki.assistivetech.net/index.php/Handwriting_Analysis_Software
http://dl.acm.org/citation.cfm?id=839278.840207
http://graphologyinformationcenter.com/2179bolognesieng.php
http://graphologyinformationcenter.com/cageng.php
http://handwriting.feedbucket.com/
http://home.wmin.ac.uk/marketingresearch/graphology/cageng.htm
http://inessa-goldberg.ru/
http://samopoznanie.ru/trainings/grafologicheskiy_analiz_diagnostika_po_pocherku_obuchajuscha/?date=61954
http://ts-si.org/horizons/19150-handwriting-analysis-ups-ante-for-lie-detection
http://www.forensicscomputer.net/
http://www.garthmichaels.com/
http://www.grafologia-ekb.ru/
http://www.haprogram.com/products.asp
http://www.inpsycho.ru/edu_add/grafologicheskiy-analiz/o-programme.html
http://www.llop-centre.com/M.Llop_Software/graf-e.htm
http://www.neuroscript.net/help/gripalyzer.html
http://www.neuroscript.net/movalyzer.php
http://www.neuroscript.net/scriptalyzer.php
http://www.quackwatch.org/01QuackeryRelatedTopics/Tests/grapho.html
http://www.quantumenterprises.co.uk/handwriting/hwaintro.htm
http://www.quantumenterprises.co.uk/handwriting/hwservfree.htm
http://www.sheilalowe.com/software.php
http://www.storytron.com/Tutorial/t-b-06-scriptalyzer.html
http://www.writinganalysis.com/

http://advego.ru/text/seo/top/ Семантический анализ текста онлайн, seo-анализ текста. Описание
http://www.nejaden.ru/seo_analiz_teksta/ или http://russkoe-seo.ru/semanticheskij-analiz-teksta/

http://htmlweb.ru/analiz/semantic_text.php,
http://stxt.ru/


The Yoshikoder download >
Freeware:
The Yoshikoder является кросс-платформенной многоязычный программой контент-анализа. Разработана как часть проекта Identity Project в центре по международным делам Гарвардского университета.
Программа работает с текстовыми документами в стандартной (ASCII, Unicode) или национальной (китайский Big5) кодировке. Есть возможность просмотреть и сохранить ключевые слова из контекста. Программа позволяет написать словари контент-анализа. Yoshikoder обеспечивает анализ документов и выдает результат в виде таблицы, например по частотности слов или контент-анализ. Собственным форматом программы является XML.

Tropes download >
Freeware:
Tropes - эта программа предназначена для семантической классификации, выделения ключевых слов, лингвистического и качественного анализа. Данное программное обеспечение идеальным инструментом для исследований в области информационных технологий, исследования рынка, социологического анализа, научных и медицинских исследований и др.

General Inquirer download >
Freeware:
General Inquirer - программа предназначеная для контент-анализа текстов на английском языке, с возможностью использования любых словарей, созданных пользователей.

MCCA Lite download >
Freeware:
MCCA Lite - программа для контент-анализа текста с помощью встроенных словарей. Можно проводить сортировку результатов.

TABARI (Text Analysis By Augmented Replacement Instrustions) download >
Freeware:
TABARI - программа, специально разработанная для анализа коротких текстов, таких как небольшие новостные статьи. Проводит грамматический разбор и выявляет, например, агрессора, жертву, действие, а также дату проведения какого-либо мероприятия.
LEXA download >
Freeware:
LEXA - набор программ для работы с тегами, леммами, токенами, частотой слов, и рядом других функций для компьютерного анализа текста.
Сервис для фоносематического анализа слов перейти
Фоносематический анализ есть определение качественных характеристик слова не по значению, а по звучанию.
Если в сервисе, Вы анализируете псевдоним, имя, фамилию или отчество, то результат фоносемантического анализа не характеризует Вас как личность. Он даёт лишь фоносемантическую характеристику слова. То есть при восприятии этого слова у большинства людей на подсознательном уровне формируется именно такое впечатление.

VisialText download >
Freeware:
VisialText – это современный, мощный, полезный и красивый аналитический инструмент для лингвиста. VisualText это кульминация многих лет исследований и разработок в области обработки естественного языка. Продукция компании разработчика, основана на программных средствах для разработки точного, надежного и расширяемого анализатора текста.
MALLET download >
Freeware:
MALLET – Это программа обработки естественного языка, классификации документов, кластеризации, тема моделирования, извлечения информации, а также других приложений машинного обучения в тексте.
MALLET включает в себя сложные инструменты для классификации документов: эффективные программы для преобразования текста, широкий спектр алгоритмов (в том числе алгоритмы максимальной энтропии, деревья принятия решений), а также код для оценки классификатора производительности с помощью нескольких часто используемых показателей.
В дополнение к классификации, MALLET включает в себя инструменты для последовательности тегов для таких приложений, как извлечение названий субъекта из текста.
Crawdad Text Analysis System 1.2 download >
Shareware:
Crawdad Text Analysis позволяет проводить анализ текста с учетом ключевых слов, отображением понятий, возможностью полнотекстового поиска, сравнением нескольких текстов, автоматической кластеризации набора текстов, анализом текстов по темам, основанного на подходе факторного анализа.
Если обычно вы вручную программируете базу данных, то, при использовании Crawdad Text Analysis вы обнаружите, что время кодирования данных сократится на 95%, а результаты останутся такими же точными. Программа проста в использовании.

LIWC download >
Shareware:
LIWC - программное обеспечение для анализа текстов, для вычисления частотности использования слов человеком в электронных письмах, в речи, стихах и др. Позволяет определить степень эмоциональной нагрузки текста.

The Ethnograph download >
Commercial:
The Ethnograph - программное обеспечение для качественных исследований и анализа данных, упрощает управление и анализ текстовых данных, таких как стенограммы интервью, фокус-группы, полевые записи, дневники, протоколы заседаний и другие документы.

http://www.lexalytics.com/web-demo
Phrases are marked in original text based on their sentiment score as: Negative, Neutral, Positive.


https://www.leximancer.com/


CATPAC download >
Commercial:
CAPTAC - программа для анализа текстов по образцу, в котором содержатся ключевые понятия. Программы была разработана для анализа формирования и изменения связей в социологическом контексте. В качестве входных данных используются текстовые файлы, на выходе - частотный список слов по алфавиту, а также различные виды кластерного анализа.

Diction 6.0 download >
Commercial:
Diction - это приложение для Windows которое производит поиск части текста по пяти семантическим особенностям: активность, оптимизм, уверенность, реализм, общность.
Поиск проводиться с помощью корпуса в 10000 словоформ. Также можно создавать собственные словари. Выходные данные включают в себя сырые подсчеты, проценты и стандартизированные подсчеты распределения.

DIMAP download >
Commercial:
DIMAP - программа, позволяющая создавать и поддерживать словари для использования в исследованиях естественного языка. Программа включает в себя инструменты для работы со словарями. С DIMAP, пользователи могут создавать, редактировать, сохранять, искать и сравнивать установленные словари. Программа также включает в себя модуль компьютерного анализа текста.

INTEXT/TextQuest - Text Analysis Software download >
Commercial:
INTEXT/TextQuest - программа, предназначенная для анализа текстов в области гуманитарных и социальных наук. Осуществляет анализ текста, индексирование, согласование, анализ структуры, списка слов, последовательности слов, стилистику и многое другое.

PCAD 2000 download >
Commercial:
PCAD 2000 - программа, разработанная Американской психиатрической ассоциацией для контент-анализа текстов и оценка на предмет враждебности, социального отчуждения, когнитивных нарушений, депрессий. Программа имеет преимущество за счет диагностических функций.

SALT (Systematic Analysis of Language Transcripts) download >
Commercial:
SALT - программа предназначена в первую очередь для помощи врачам в определении и документировании конкретных проблем языка. Выполняет множество анализов, в том числе анализ типов высказываний (неполный, непонятный, невербальный), средняя длина высказываний, продолжительность пауз, скорость речи и частотные наборы слов (негативы, союзы и т. д.).

Profiler Plus download >
Commercial:
Profiler Plus - программа входит в число продуктов и сервисов компании Social Science Automation (SSA) для изучения и понимания человеческого разума через анализ текстов. Технология Profiler Plus предназначена для автоматического анализа текста, построения и использования схем закодированного текста.

[ Statistical Analysis ]

Online анализ и статистика текста: http://www.gsgen.ru/index.php?id=4
Показатели статистики текста:- Количество символов с пробелами и без пробелов.- Количество слов и предложений.- Количество вхождений заданного фрагмента текста.

http://www.edsoft.ru/raznoe/336.html бесплатная программа Wordstat для составления и сохранения частотного словаря

http://advego.ru/text/seo/ - семантический анализ текста, построение частотного словаря

Как работать с Textus Pro http://net-bloga.ru/seo-soft/31-rabota-s-tekstom-pri-pomoshi-textus-pro-statistika-slov-i-fraz
http://www.blog-kaplunoff.ru/poleznosti/41-novaya-programma-dlya-kopirajterov-textus-pro.html
http://www.tvoyshans.com.ua/soft/programs-for-earn/126-textus-pro.html

http://www.practiline.com/
PractiCount and Invoice is a word and line counting and invoicing program for freelance translators, translation and localization agencies, medical transcriptionists, medical transcription agencies, legal transcriptionists and legal transcription agencies, writers, project managers and other professionals who base their quotations and invoices on document text count (word count, line count, gross line count, character count, page count or other text count types, as well as hours/minutes). Our tool handles all these text statistics types thus saving you tremendous amounts of time.

With the help of our utility you can batch count
  • Words
  • Characters with spaces
  • Characters without spaces
  • Lines (per set number of characters with/without spaces)
  • Gross lines (nominal lines)
  • Pages (per set number of characters with/without spaces, words, lines)
  • Printed pages
  • Word repetitions
Japanese, Chinese characters, Korean Words

Go to the download page to get your free word count and line count software 15 days trial download or go directly to the order page to order online your license for the fully functional version of PractiCount and Invoice - the best text counting software in the market.
http://www.sweden4rus.nu/rus/slovar/translate/text_analysis.asp- анализатор текста.

Сервисы анализа статистики текста: считаем предложения, слова, знаки

http://www.readabilityformulas.com/search/pages/Free_Readability_Calculators/
http://www.psychol-ok.ru/library.html#mat
Dataplot download >
Freeware:
Dataplot – Программа для научной визуализации, статистического анализа и нелинейного моделирования. Данная программа создана для исследователей и аналитиков, которые занимаются характеристикой, моделированием, визуализацией, анализом, мониторингом и оптимизацией научных и инженерных процессов.

MicrOsiris download >
Freeware:
MicrOsiris – Данная программа разработана в Van Eck Computer Consulting.
Это комплексный статистический программный пакет, включающий в себя специальные техники для анализа.
Инструкция по использованию: http://www.microsiris.com/Manual/MICROSIRIS.pdf

VassarStats download >
Freeware:
VassarStats – Удобная и легкая в использовании программа для представления статистического подсчета.
Разработчик - Ричард Лоури (Richard Lowry), профессор колледжа Вассар, США.

Open Epi download >
Freeware:
Open Epi – Программа предоставляет статистику для подсчета и размера в описательном и аналитическом исследовании, а также стратифицирует анализ с точными пределами.
Программа может работать с веб-сервера или загрузить и запустить без соединения с Интернетом.Сервер не требуется.

http://orange.biolab.si/

Sample Size Calculator download >
Freeware:
Sample Size Calculator – Простая он-лайн программа для подсчета примерного размера в соответствие с различными вариантами.
Разработчики - MaCorr Market Research Surveys

QDA Miner download >
Commercial:
QDA Miner - простая в использовании программа для качественного анализа данных и кодирования текстовой информации, аннотирования, извлечения данных.
руководство на русском языке

WordStat download >
WordStatЭто программа для статистического анализа текста.


[ Concordancing ]
http://voyeurtools.org/
http://hermeneuti.ca/voyeur/tools - инструменты анализа текста
http://hermeneuti.ca/voyeur/users - описание
http://hermeneuti.ca/rhetoric/now-analyze-that - пример анализа

https://sites.google.com/site/philologic3/home


TextStat download >
Freeware:
TextStat – это простая программа для построения конкорданса.
A Simple Concordance Program download >
Freeware:
A Simple Concordance Program – простая в использования и предоставляемой функциональности программа для переводчика, с помощью которой можно извлекать термины и словосочетания, задавая число слов в словосочетании. Поддерживаются алфавиты: Английский, Французский, Немецкий, Польский, Греческий, Русский.
Программа извлекает найденные термины в список, которые, после этого, могут быть отредактированы вручную.
Ещё существует возможность подключить так называемый "stop list" - список из слов, которые не относятся к терминологии. К примеру, артикли, предлоги, общие слова (little, large). Вы можете взять stop list по следующей ссылке - скачать stop list (англ. язык, названия стран, предлоги, артикли, общие слова).

CATMA download >
Freeware:
CATMA – Это практичный и интуитивно понятный инструмент для литературоведов, студентов и других сторон, заинтересованных в анализе текстов и литературных исследований. CATMA основана на JAVA и базируется для Mac и Windows. В конечном счете, CATMA будет реализована как веб-сервис, который может также быть включен в другие существующие платформы.

AntConc download >
Freeware:
AntConc – это бесплатная, мультиплатформенная программа для проведения корпусных лингвистических исследований и управления данными. Она работает на любом компьютере под управлением Microsoft Windows (проверено на Win 98/Me/2000/NT, XP, Vista, Windows 7, Linux.
AntConc содержит семь инструментов, к которым можно получить доступ, нажав на клавишу табуляции в меню инструментов, или используя функциональные клавиши F1-F7.

MonoConc Pro download >
Shareware:
MonoConc Pro – быстрая программа конкорданс для переводчика (извлечение терминологии). Она используется для анализа английских или других текстов - испанских, французских, японских, китайских и т.д. - для лингвистического или языкового преподавания и изучения языков (ESL). Наряду с предоставлением KWIC результатов конкордансом, программное обеспечение производит также информацию о списках слов и словосочетаний.
Программа проста в использовании, хотя и поставляется с целым рядом мощных функций, таких как контекстный поиск, поиск по регулярному выражению, частеречный поиск по тегам, сочетаемости слов и корпус сравнения.
Программа MonoConc Pro разработана для работы в компьютерных сетях и работает под управлением Windows в различных средах (W95 и выше). Имеет приемлемое количество настроек для поиска, но при этом является платной.
http://www.athel.com/corpdes.html - описание разметки

Concordance download >
Shareware:
Concordance – Это программа для анализа текстов, которая позволяет получить более полное представление электронных текстов, глубинный анализ языка. Программа позволяет создать частотный словарь, выделить отдельные фразы, словосочетания, леммы и т. д. Работает с большим количеством языков. Есть возможность опубликовать результаты в интернете. Присутствуют примеры конкордансов.

ParaConc download >
Shareware:
ParaConcЭто многоязычная программа для согласования параллельных текстов (перевод). Параллельно проанализованы могут быть до 4 языков. С помощью программа можно создать конкордансы параллельных текстов.




[ OTHER ]

CLAware download >
Freeware:
CLAware – представляет собой программное приложение, специально предназначенное для эффективной подачи, извлечения и анализа данных, полученных в процессе изучения нового языка и культуры, что позволяет межкультурным рабочим тратить меньше времени на управление своими данными, создавать перекрестные ссылки на текст и секции аудио файлов, встроенные изображения и звуки, обрабатывать файлы, автоматически создавать словарь, синхронизировать информацию между партнерами, и многое другое.

EthoVision download >
Shareware:
EthoVision – это высококлассная система видео-наблюдений для автоматической регистрации двигательной активности животных. Программа предлагает широкий набор возможностей видео слежения, а также мощный анализ движений и автоматического распознавания поведения.
В целом, EthoVision XT позволяет исследовать множество поведенческих реакций, включая подвижность, активность и реакцию на новый объект.

OntoLing Tab download
Freeware:
OntoLing Tab - представляет собой подключаемый модуль, с помощью которого есть возможность обогащать языковую онтологию.
При помощи модуля:
  • можно изучать имеющиеся языковые ресурсы (например: тезаурусы, словари и др);
  • лингвистически обогащать свою онтологию элементами из этих языковых ресурсов;
  • имеется возможность строительства новой онтологии;
  • доступ к любому языковому ресурсу (LR) может быть получен за счет реализации собственной оболочки, называемый лингвистическим интерфейс, который описывает абстрактные классы и интерфейсы, содержащиеся в пакете LinguisticWatermark.
http://www.ontotext.com/kim/getting-started/download

Shoebox download >
Shareware:
Shoebox – это компьютерная программа, которая помогает лингвистам и антропологам интегрировать различные виды текстовых данных: лексических, культурных, грамматических и т.д.
Она имеет гибкие настройки для сортировки, отбора и отображения данных. Это особенно полезно для оказания помощи исследователям, построить словарь, так как они используют ее для анализа текста.

ATLAS/ti download >
Shareware:
ATLAS/ti - программное обеспечение для поддержки перевода, управление текстом и извлечение концептуальных знаний из документов. Сфера применения включает социальный науки, экономику, образование, криминалистику и др.

winMAX download >
Shareware:
winMAX - программа для качественного анализа текста.

Filemaker Pro download >
Shareware:
Filemaker Pro – это передовая и простая в использовании программа работы с базами данных, с помощью которой пользователи Windows Mac могут без опасений обмениваться информацией в популярных форматах, например PDF, через локальную сеть и через Интернет. Способность FileMaker Pro 10 упорядочить важные данные так, чтобы их можно было мгновенно найти, пригодится вам в управлении клиентской базой,лежении за ходом проекта, подготовке инвентарного отчета и других задачах.
FileMaker Pro 10 оснащен инструментом для пошагового создания отчетов, который поможет разобраться в данных и автоматизировать выполнение однообразных задач. Используйте "Помощник отчетов" для создания пользовательских макетов, меток и отчетов.

Audiamus download >
Freeware:
Audiamus – создает связь между текстами и средствами массовой информации, на основе временного кода, получаемого от переработки в Transcriber или аналогичных программах.
Необходимость специального инструмента, возникла в отсутствии простого способа работы в интерактивном режиме с цифровой этнографические лентой поля, через их стенограмму.Инструмент разработан с ключевым принципом повторного использования и доступа к данным.
С Audiamus пользователь может нажать на любое предложение или кусок в корпусе и услышать его или просмотреть видео.

Text Analyzer download >
Freeware:
Text Analyzer – Программа предназначена для сравнения текстов на схожесть. Особую ценность программа представляет при отборе необходимого количества текстов с определенным критерием уникальности, сгенерированных синонимайзером (генератором текстов).
Основные преимущества:
  • Обработка производится по всем шинглам текста;
  • Семь методов обработки исходных данных;
  • Алгоритмы отбора рассчитаны на получение максимального количества текстов;
  • Возможность пакетной обработки;
  • Высокая скорость работы;
  • Встроенный конвертер форматов (*.doc, *.rtf, *.htm, *.html, *.mht) для импорта;
  • Гибкая система обработки текста перед сравнением;
  • Расширенный результат, с отображением совпавших шинглов и удельного веса - позволит исправлением нескольких слов в исходном тексте повысить его уникальность на необходимый уровень;
  • Гибкая система настройки процесса обработки с поддержкой профилей для максимально быстрого старта.

Emdros download >
Freeware:
Emdros – это процессор текстовой базы данных для аннотирования и анализа текстов.
Прикладные области применения включают лингвистику, публикацию, текстовую обработку, и любые другие области, которые имеют дело с аннотируемым текстом. Emdros обеспечивает концептуальную модель текста, который может весьма освобождать, чтобы использовать, как только это было схвачено.
Emdros имеет мощный язык запросов для поиска релевантных запросу данных. Это связующее звено, функционирующее между клиентской частью (написанной пользователем) и нижележащей базой данных. Имеет поддержку PostgreSQL и MySQL.
Emdros обеспечивает определенную абстракцию текста, который делает его идеально подходящий для хранения и восстановления аннотируемого текста, такого как лингвистические исследования текста.

Systemic Coder download >
Freeware:
SystemicCoder - программа, облегчающая процесс метаописания корпуса текстов. Метаданные задаются на основе классификационной схемы.
Программа состоит из 5 интерфейсов.
  • TextSegmentation: разметка границ между сегментами текста;
  • SchemeManagement: настройка классификационной схемы;
  • Coding: разметка текста;
  • Review: просмотр размеченного текста;
  • Statistics: интерфейс, позволяющий получить описательную статистику о тексте, или разделить его на две или более совокупности и статистически их сравнить.
Данный инструмент способствует языковой кодировки материала, через побуждение пользователей к соответствующим категориям. Лингвистические особенности организованы с точки зрения системной сети - иерархия наследования - уменьшает количество кодирования.

IDD (The Indiana Dictionary Database) download >
Freeware:
Мультимедийная программа словаря базы данных в Microsoft Visual FoxPro, который был создан специально для составления словарей индейских языков. В настоящее время, программе находится в завершающей стадии разработки.
Программа предназначена для поддержки стандартного текстового языкового материала, а также звуковых данных, графических изображений и видеоклипов.

FASTR download >
Freeware:
FASTR – инструмент для автоматического индексирования и извлечения терминологии.
На входе корпус и перечень терминов, а на выходе индексированные данные корпуса, в котором признаются условия и варианты.
Программа может использоваться в двух режимах:
  • Контролируемая индексация: вход состоит из корпуса и списка терминов;
  • Бесплатная индексации: вход только состоит из корпуса, списка терминов, получаемых автоматически.

NLTK download >
Freeware:
NLTK – это языковой инструментарий языка. Инструмент представляет собой набор программных модулей, а также набор данных и учебников для поддержки исследований, обучения в компьютерной лингвистике и обработки естественного языка.
NLTK идеально подходит для студентов, которые изучают НЛП (Natural Language Processing) или проведения научных исследований в НЛП или смежных областях, в том числе эмпирической лингвистики, когнитивной науки, искусственном интеллекте, поиске информации и машинном обучении.
NLTK успешно используется в качестве учебного пособия, как отдельных инструментов исследования, и в качестве платформы для систем прототипирования и создания исследований.

RSTTool download >
Freeware:
RSTTool представляет собой графический интерфейс для разметки структуры текста.
Инструмент состоит из четырех интерфейсов:
  • Text Segmentation: для обозначения границ между сегментами текста.
  • Text Structuring: для обозначения структурных отношений между этими сегментами.
  • Relation Editor: для поддержания множества дискурса отношений и схем.
  • Statistics: для получения простой описательной статистики на основе анализа.
  • Программа работает под Windows, Macintosh, Unix и операционной системе Linux. Движок программы - скриптовый язык.

Annotate download >
Shareware:
Annotate – это простой в использовании, удобный, настраиваемый, и графический инструмент для аннотирования предложения с синтаксическими структурами, которые были успешно использованы при создании Negra корпуса.
Annotate обеспечивает удобный и настраиваемый графический интерфейс пользователя, что значительно облегчает трудоемкую задачу синтаксической аннотации. По этой причине он уже используется в ряде проектов. Комментировать доступна бесплатно для научных целей.

jEdit download >
Freeware:
jEdit – это бесплатный текстовый редактор созданный для упрощения работы программистов.
Среди возможностей управления открытым документом можно отметить средства для вертикального выделения, для выделения нескольких фрагментов текста, расположенных в разных местах файла. Если требуется найти в документе определенное сочетание символов, можно обратиться к встроенным средствам для поиска. jEdit позволяет выполнять поиск в нескольких файлах одновременно, автоматически заменять одно выражение другим.
Данный редактор отличная замена платным программам, имеется все функции для работы, возможности программы легко расширяются благодаря большому количеству плагинов. Имеется поддержка всех основных языков программирования и верстки.

AMPLE download >
Freeware:
AMPLE - это морфологический анализатор для лингвистического исследования, при наличии необходимых сведений о морфологии языка, достаточно будет проанализировать каждое слово в тексте и разбить его на морфемы.

Ukelele download >
Freeware:
Ukelele – это редактор раскладки клавиатуры для операционной системы Mac OS X версии 10.2 и выше.
Целью редактора является упрощение редактирования раскладки клавиатуры, предоставляя графический интерфейс.
При создании новой раскладки вам предложат создать абсолютно пустую, либо основанную на системной или готовой. Надёжнее выбрать третий вариант и нажав «ОК» найти среди полученный с программой раскладок русскую (Cyrillic/Russian.keylayout). Перед вами появится готовая раскладка, которую можно изменять на ваше усмотрение.

TypeTool download >
Shareware:
TypeTool – редактор шрифтов с базовой функциональной нагрузкой. Программа создана на основе пакета FontLab, отличается от него упрощенностью и более низкой ценой. Редактор предназначен для создания новых и редактирования готовых шрифтов форматов Post Script Type 1 (CFF/.otf) и TrueType (.ttf).
С помощью TypeTool можно создать новый шрифт, добавить лигатуры, дроби, валютные знаки. Поддерживаются неалфавитные шрифты и политипажи. В готовый шрифт можно добавить короткое тире, длинное тире, апострофы, кавычки. Возможно создать модификацию шрифта, а также преобразовать его формат. TypeTool имеет встроенные средства для печати таблиц символов.
Инструменты, доступные в TypeTool: Draw, Erase, Rotate, Skew, Zoom, Set Startpoint, Insert Node, Remove Overlap, Merge Contours, Subtract Contours, Intersect Contours, Snap to Guides, Ruler, Undo (200 позиций), Autohint, Remove hints, Decompose.
К сожалению, программа не имеет русификации и руководства на русском языке. Поэтому для начала будет полезно открыть готовый шрифт и на нем изучить основные операции. После этого можно приступать к выполнению более сложных задач.

FontLab Studio download >
Shareware:
FontLab Studio – это уникальный профессиональный редактор шрифтов. Программа, которая даёт возможность редактирования шрифтов на профессиональном уровне.
Она используется такими известными компаниями, как Adobe, Apple, Bitstream, IBM, Linotype, Microsoft, Monotype и многими другими. Fontlab Studio создана для печатников, профессиональных дизайнеров и студии, занимающихся графическим дизайном. Она поддерживает такие шрифты как TrueType, Type 1 (PS), OpenType и Unicode. FontLab Studio обеспечивает огромный выбор различных функций для создания, модификации и обработки шрифтов.

Keyman download >
Commercial:
Keyman – это менеджер горячих клавиш, который позволяет работать с нестандартными клавишами на мультимедийных расширенных клавиатурах, без установки дополнительных драйверов.
Программа проста в управлении, но содержит множество дополнительных настроек и будет полезна как простым пользователям, так и профессионалам - настоящим клавиатурным маньякам.
Возможности программы:
  • Использование любых клавиш, в том числе системных – Win+D, Alt+Tab, ect.
  • Использование кнопок мыши в горячих клавишах - Mouse LButton, Mouse RButton, Mouse MButton, Mouse XButton1, Mouse XButton2 (например: Ctrl+Alt+Mouse MButton).
  • Запись и воспроизведение клавиатурных макросов.
  • Изменение клавиатурных раскладок.
  • Отправление окна сообщения при нажатии клавиши.
  • Многоязычный интерфейс.

AGTK (Annotation Graph Toolkit) download >
Freeware:
AGTK это набор программных компонентов для создания инструментов для аннотирования языковых сигналов, временных рядов данных, которые документирует любое языковое поведение (например: аудио, видео).
Annotation Graph абстрагируются от форматов файлов, схем кодирования и пользовательских интерфейсов, обеспечивая логический уровень для аннотационных систем.

Quintura download >
Freeware:
Quintura Это бесплатная программа, предназначенная для более удобного поиска в Интернете. В основе программы - принципы естественного ассоциативного поиска. Quintura использует динамическое интерактивное облако тегов по результатам запросов для управления поиском.
Особенность Quintura — визуальное «облако тегов», или карта, слов-ассоциаций между картинками или документами, которая является удобным навигатором по ним. Используя принцип Quintura, когда поиск осуществляется одним щелчком мыши, пользователь видит слова на карте и щёлкает мышкой по ним, быстро находя необходимые картинки и документы.
http://www.quintura.ru/ - визуальная поисковая система

Ktagger download >
Freeware:
Ktagger – это автономное приложение, построенное с базовыми функциями анализатора PC-Киммо. Она принимает в качестве входных файлов список слов, состоящих из одного слова в каждой строке, и производит на выходе структурированные текстовые файлы, содержащие морфологический разбор. Содержание и формат выходного файла определяется "контроль" файл построенный пользователем.
KTagger может быть использован для производства лексикона слова или любого другого вида структурированного выхода. Для использования KTagger, необходимо PC-Киммо языка описания, такие как Englex. Описание должно включать файл грамматики.
KTagger позволит вам использовать морфологический анализатор для маркировки.

MediaTagger download >
Freeware:
MediaTagger – является бесплатной программой, для редактироватния комментариев (тегов) в мультимедийных звуковых файлах.
Формат MP3 (уровень MPEG 3) является форматом музыкального файла. Каждый файл MP3 может содержать тег ID3. Это - фактически информация, хранящаяся прямо в том файле MP3. У тега ID3 есть несколько ячеек, которые можно установить: Артист, Альбом, Год, Жанр, Комментарий и еще несколько, такие как: Формирователь, Авторское право, URL, тип Кодера, и т.д.

Ktext download >
Freeware:
Ktext – программа читает текст из файлов на любом диске, анализирует каждое слово с помощью анализатора PC-KIMMO и записывает результаты в новый файл на диске.
Этот новый файл в виде структурированного текстового файла, где каждое слово исходного текста представляется в виде записи в базе данных состоящей из нескольких полей. Каждое слово записи содержит поля для исходного слова, поле для основной или лексической формы слова.

PC-Parse download >
Freeware:
PC-Parse – этот архив содержит набор программ для выполнения морфологического или синтаксического анализа. PC-PARSE включает в себя код.
Содержимое архива:
  • AMPLE;
  • PC-KIMMO;
  • PC-PATR;
  • STAMP;
  • ToneGen;
  • TonePars.

MorphAdorner download >
Freeware:
MorphAdorner это инструмент, который предоставляет методы для "украшения" текста со стандартным написанием, частями речи и леммами. MorphAdorner также предоставляет средства для разметка текста.
MorphAdorner претерпел непрерывного развитие в сочетании с тремя проектами: WordHoard, Monk, проект виртуальная Ортогональная стандартизации и части речи Tagging (VOSPOS). Все три проекта в настоящее время завершена. Хотя MorphAdorner был использован в этих проектах, на самом деле это отдельный проект, в своем собственном праве.
Вы можете узнать больше информации об инструменте, а также посмотреть онлайн демонстрацию, выбрав пункт меню слева на главной странице сайта.

WinCecil download >
Freeware:
WinCecil – Это программа для просмотра записи речи и составления спектрограмм. Предел записи речи составляет 3 секунды.
Модернизированная версия называется Speech Analyzer, которая является свободным и профессиональным инструментом, который показывает различные графические изображения речи и звукозаписей. Это позволит вам выполнять фонетический анализ записей человеческого голоса (полный со спектрограммами, спектральным анализом, и т.д.), и этнологические изучения звукозаписей. Программа может показать вам до шести графических изображений того же самого звука или группу звуков в одном единственном экране, таким образом облегчающем для вас выполнять все виды сравнительного анализа. Все доступные графики могут быть полностью настроены, чтобы приспособить ваше предпочтение.

NUDIST download >
Freeware:
NUDIST Это программа помогает исследователям в обработке не числовых неструктурированных данных при индексировании, поиске и теоретизировании. Программа автоматизирует работу с кодированием текста и импортом данных.

Wordle http://allmyapps.com/apps/wordle
Freeware:
Wordle это генератор облака слов. Облако выделяет слова, которые чаще встречаются в исходном тексте. Вы можете настроить различные шрифты, макеты и цветовые схемы вашего облака. Таким образом можно подводить итоги опросов, как, например, это сделано на иллюстрации справа.
Можно обработать текст и определить частотность того или иного слова, ещё есть возможность сделать разные графические баннеры, которые выглядят весьма симпатично и оригинально.
Эти картинки Вы можете распечатать или сохранить в Wordle галерею, чтобы поделиться ими с друзьями.

TagCrowd (beta version) http://www.tagcrowd.com/
Shareware:
TagCrowd это сервис, который позволяет создавать облако тегов из обычного текста. Облако тегов необходимо для визуализации частоты употребления слов в любом тексте.
Использовать сервис очень легко, просто введите слова, которые вы хотите визуализировать в моде облака тегов и настройте параметры. Нажмите кнопку "Визуализация", чтобы увидеть результат.
У вас есть 3 варианта использоватния вашего текста: URL ссылки, файлы на вашем компьютере, или просто вставка блоков текста на сайте. Эта простота использования позволяют пользователям управлять своим текстом для различных целей.

GNU Emacs download >
Freeware:
Emacs - это программа с практически неограниченными возможностями. Emacs написан на Lisp - очень мощном языке программирования, характерной особенностью которого является то, что любая написанная на этом языке программа автоматически сама для себя является компилятором Lisp. Это означает, что пользователь может самостоятельно расширять возможности Emacs, а по сути писать новые программы “на Emacs'е”.
Существует две основные версии Emacs: GNU Emacs (эта версия входит в состав Slackware) и XEmacs. В настоящее время обе версии активно разрабатываются, и между двумя командами разработчиков ведётся тесное сотрудничество.

Toolbox download >
Freeware:
Toolbox (The Field Linguist’s Toolbox) - текстоориентированная система управления базами данных с дополнительными функциональными возможностями для лингвиста.
Toolbox - одна из многочисленных программ, созданных в рамках международного проекта SIL (Summer Institute of Linguistics) - некоммерческой организации, занимающейся исследованием языка с 1934 года.
Последняя версия Toolbox (Version 1.5.9) вышла в апреле 2011 года. Русскоязычный интерфейс отсутствует.
Будучи разработанным в качестве инструмента для проведения полевых исследований, Toolbox особенно полезен для обработки лексических данных, для парсинга и межлинеаризации текста, он также может быть использован для обработки любых других данных.
Полезную информацию по использованию всех возможностей Toolbox Вы можете найти на странице http://www.sil.org/computing/toolbox/techniques.htm

Ellogon download >
Freeware:
Ellogonмногоязычная, кросс-платформенная, среда, разработана для того, чтобы помочь и исследователям, которые проводят исследования в компьютерной лингвистике, а также компаниям, которые производят и поставляют языковые системы.
Как языковая платформа, Ellogon предлагает обширный набор средств, включая инструменты для обработки и визуализации такста, HTML, XML данных. Поддержку лексических ресурсов как создание и вложение словарей, инструментов для того, чтобы создать аннотируемые корпуса, получая доступ к базам данных, сравнивая аннотируемые данные, или преобразовывая лингвистическую информацию в векторы для использования с различными машинными алгоритмами изучения.

PhoneBox download >
Freeware:
PhoneBox – это утилита для фонологического анализа данных с использованием языка.
С PhoneBox вы можете:
  • использовать фонетические данные, собранные с панели инструментов без импорта или преобразования;
  • создать таблицу всех телефонов в ваших данных, и как часто они происходят (телефон инвентаризации);
  • создания среды-карты всех телефонов в ваших данных;
  • отметить телефоны, неопределенность в данных, а затем создать карты всех; неопределенных телефонов;увидеть, как интерпретация неоднозначного сегмента и неоднозначной последовательности влияет на слог модели данных.
  • создать диаграмму всех сегментов последовательностей в данных, которые соответствуют (графики распределения);
  • использовать любой шрифт или символ для обозначения поддерживаемых инструментов, в том числе Unicode UTF-8;
  • импорт таблицы порожденных PhoneBox в Microsoft Word для отображения и печати, телефонные карты или карты распределения.

PalmSurv download >
Freeware:
PalmSurv – это программное обеспечение, позволяющее делать списки слов в какой то области данных.
Различные представления данных позволяют визуально сравнивать списки слов. Данные списка слов могут быть переданы к настольному компьютеру через HotSync.
PalmSurv предназначена только в качестве сбора данных и не делает любой статистический анализ собранных данных.

System Quirk download >
Freeware:
System Quirk – приложение предназначено для оказания помощи в создании и поддержании текстов и терминов. Эти приложения имеет особое значение для прикладных лингвистов и языковых инженеров.
Приложение использует действительно объектно-ориентированное представление данных терминологии и усовершенствованный анализатор текста и его визуализацию.
Менеджер терминологии данных системы Quirk уже настроен на поддержку терминологии баз знаний. Профиль для выполнения различных задач может быть предопределен опытным пользователем, чтобы начинающим пользователям работа была более продуктивной.

Kirrkirr download >
Freeware:
Kirrkirr – этот исследовательский проект изучает возможность использования программного обеспечения для автоматического преобразования лексической базы данных ("Словари"), направленной на обеспечение инновационного визуализации информации, особенно ориентированных на языки коренных народов.
О подготовке словаря для Kirrkirr

XMLSpy download >
Shareware:
XMLSpy – это лидирующая среда разработки XML в своей сфере, предоставляющая понятные редакторские виды и мощные XML утилиты, для моделирования, редактирования, трансформации и устранения неполадок технологий относящихся к XML быстро и легко.
XMLSpy стал одним из наиболее признанных инструментов своей категории вскоре после его выпуска в 1999. Продукт часто обновляется, чтобы обеспечивать поддержку новейших технологий. Была добавлена поддержка стандарта Office Open XML, применяющегося в Microsoft Office 2007.
XMLSpy поддерживает несколько режимов и возможностей редактирования, как например:
  • Создание и редактирование документов на основе XML
  • Визуальная разработка XML Schema
  • Редактирование DTD
  • Разработка и отладка XSLT 1.0/2.0
  • Разработка и отладка XQuery
  • Разработка и анализ XPath 1.0/2.0
  • Разработка Office Open XML
  • Разработка веб-служб
  • Графическое создание и редактирование WSDL
  • Разработка и отладка SOAP
  • Генерация кода Java, C++, C#

Автоматическая обработка текста

Машинный перевод



[ КАТАЛОГИ ЛИНГВИСТИЧЕСКИХ ИНСТРУМЕНТОВ ]
Каталог_1
Данный каталог включает в себя описание программ, связанных с анализом текстов и вычислительной лингвистикой, а также соответствующих ресурсов, доступных сегодня в глобальной сети Интернет. Упор при составлении каталога делался на бесплатные программы, доступные для загрузки. Однако также описаны некоторые on-line и коммерческие версии программ.

Каталог_2 Каталог_3 Каталог_4 Каталог_5
Данные каталоги объединяются тем, что все содержат аннотированный ряд инструментов для лингвистического анализа и лингвистической обработки текстов.

Каталог_6
Каталог включает инструменты, которые помогут пользователям в работе по статистической обработке естественного языка.

Каталог_7
В каталоге имеются инструменты для контент-анализа данных.

Каталог_8
В каталоге представлены инструменты для анализа текста, а также информационно-поисковое программное обеспечение. Инструменты разделены по трем категориям доступности: Commercial | online | free.

программки:
http://nltk.org/index.html
http://opus.lingfil.uu.se/index.php
http://corpus.nie.edu.sg/cgi-bin/lcmc/conc.pl
http://aune.lpl.univ-aix.fr/projects/multext/
http://www.xces.org/




Crawdad Text Analysis позволяет проводить анализ текста с учетом ключевых слов, отображением понятий, возможностью полнотекстового поиска, сравнением нескольких текстов, автоматической кластеризации набора текстов, анализом текстов по темам, основанного на подходе факторного анализа.
Разделы прикладной лингвистики:












Если обычно вы вручную программируете базу данных, то, при использовании Crawdad Text Analysis, вы обнаружите, что время кодирования данных сократится на 95%, а результаты останутся такими же точными. Crawdad Text Analysis - простая в использовании и мощная программа для анализа текста.IBM VideoAnnEx Annotation Tool