<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="/~d/styles/rss2enclosuresfull.xsl"?><?xml-stylesheet type="text/css" media="screen" href="http://feeds.feedburner.com/~d/styles/itemcontent.css"?><rss xmlns:media="http://search.yahoo.com/mrss/" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">
  <channel>
    <title>Integra desktop search</title>
    <link>http://solarix.ru/for_developers/news/developing-en.shtml</link>
    <description><![CDATA[Integra desktop search]]></description>
    <lastBuildDate>Sun, 27 May 2012 11:29:33 GMT</lastBuildDate>
    <generator>Feed43 Proxy/1.0 (www.feed43.com)</generator>
    <ttl>360</ttl>

<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" type="application/rss+xml" href="http://feeds.feedburner.com/IntegraDesktopSearch" /><feedburner:info uri="integradesktopsearch" /><atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="hub" href="http://pubsubhubbub.appspot.com/" /><itunes:explicit>no</itunes:explicit><itunes:subtitle>Integra desktop search</itunes:subtitle><feedburner:browserFriendly></feedburner:browserFriendly><item>
<guid isPermaLink="false">3feefbcf6c4241a6e9b2c051a3ac30bc</guid>
<title>Опубликован небольшой FAQ</title>
<description><![CDATA[</p> <p><a href='http://solarix.ru/russian_grammar_dictionary/faq.shtml'>Ответы на частые вопросы - здесь</a>. Список будет постепенно пополняться.</p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">e3aa372653aa5031810dc04763368f40</guid>
<title>Релиз версии 11.16</title>
<description><![CDATA[</p> <p><a href='http://solarix.ru/for_developers/news/changelog.v11.16.txt'>Сокращенный список изменений</a></p> <p>1. Главное изменение относительно предыдущего релиза - полностью переработанный анализатор английских предложений, основанный на новой, очень перспективной алгоритмической базе. Английский словарный модуль вместе с <a href='http://solarix.ru/for_developers/docs/rules.shtml'>новым парсером</a> выделены в отдельный вариант для всех продуктов - <a href='http://solarix.ru/grammatical-dictionary-api-en.shtml'>SDK Грамматического Словаря</a>, <a href='http://solarix.ru/sql-dictionary-sdk-en.shtml'>SQL Морфологический Словарь</a> и <a href='http://solarix.ru/grammar-server-en.shtml'>Грамматический Сервер</a>.</p> <p>Словарный запас в английском лексиконе расширен до 210 тысяч статей. Правила разбора предложений охватывают приблизительно начальный уровень изучающих английский язык. Некоторые английские конструкции охвачены пока хуже, чем они того заслуживают, но со временем эти лакуны будут закрыты. Английский парсер проверяется по 9000 эталонных предложений, в том числе в многопоточном режиме.</p> <p>2. Первый релиз <a href='http://solarix.ru/grammar-server.shtml'>Грамматического Сервера</a>. Он сочетает гибкость SQL словаря и возможность доступа к грамматическим алгоритмам в <a href='http://solarix.ru/for_developers/api/grammar-engine-api.shtml'>процедурном API</a>. Пока собрана и протестирована реализация для варианта БД на MySQL и 32-битного клиента под MS Windows.</p> <p>3. Русский словарь претерпел в целом незначительные изменения. Модуль синтаксического разбора русских предложений по-прежнему основан на <a href='http://solarix.ru/for_developers/docs/transformation.shtml'>правилах переписывания</a>. В сравнении с новым структурным парсером, обкатанным на английской грамматике, у него есть некоторые серьезные ограничения. В будущем запланировано переписать русский парсер полностью на новом движке с добавлением некоторых новых возможностей - самообучение и самонастройка, расширенное использование правил снятия омонимии, задание placeholder'ов для ФИО, топонимов и брендов.</p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">f1f4b77d4405aac348292fc2e74a80c8</guid>
<title>SDK Free Trial Beta v.11.03</title>
<description><![CDATA[</p> <p>В эту сборку ознакомительной версии SDK грамматического словаря вошли следующие компоненты:</p> <p>1. полностью переработанный английский словарь с 210 тысячами статей, 339 тысячами уникальных слов, новый движок синтаксического анализа предложений.</p> <p>2. русский словарь со всеми последними исправлениями, объем примерно такой же, как у версии 10. Содержит примерно 159 тысяч статей, против ~200 тысяч для полной сборки.</p> <p>Для работы с английским словарем достаточно переименовать папку bin-windows-english в bin-windows. Синтаксический анализатор для английского языка обучен разбирать базовые конструкции английского предложения примерно в рамках курса для начинающих изучать язык. Тестовый набор содержит приблизительно 3000 предлождений, для которых он выполняет part of speech tagging и разрешение неоднозначностей.</p> <p>Эта версия имеет статус беты и предназначена на предварительной обкатки.</p> <p><a href='http://www.solarix.ru/download/win/sdk-grammar-engine-demo-11.exe'>скачать дистрибутив для MS Windows 32 бита (27 Мб)</a></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">b33ee8b0fa091586d38fe9748cddda93</guid>
<title>Новая сборка русско-английского словаря</title>
<description><![CDATA[</p> <p>Браузер словаря пересобран с самой последней ревизией английского и русского лексикона. Текущий объем словаря достиг ~202 тысячи статей для английского языка и ~178 тысяч для русского. Суммарно это дает примерно 2.8 миллиона форм слов.</p> <p><a href='http://www.solarix.ru/download/win/russian-grammar-setup.exe'>Скачать браузер словаря (43 Мб)</a></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">9f557911b00c877a1e9cfdea9ef30dce</guid>
<title>Обновление демо-версии SDK</title>
<description><![CDATA[</p> <p>В новой сборке ознакомительной версии добавлены исходные тексты примера работы с API на Delphi в каталоге ...\demo\ai\solarix\Grammar_Engine\Delphi</p> <p><a href='http://www.solarix.ru/download/win/sdk-grammar-engine-demo.exe'>Скачать архив демо SDK (20 Мб)</a></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">9658308be8a2a22e1ce8d05c3e404f1a</guid>
<title>Новые демо-версии SQL словаря</title>
<description><![CDATA[</p> <p>Способ формирования ознакомительных версий <a href='http://www.solarix.ru/sql-dictionary-sdk.shtml'>SQL словаря<a> переработан таким образом, чтобы получался словарь с 10000 самых частотных <a href='http://solarix.ru/for_developers/docs/entries.shtml'>словарных статей</a>. Прежние ознакомительные версии содержали словарные статьи на одну (или несколько) определенных <a href='http://solarix.ru/for_developers/docs/alphabet.shtml'>букв</a>.</p> <p>Ссылки на новые ознакомительные версии для нескольких моделей СУБД:</p> <p class="normal_text"><a href="http://www.solarix.ru/for_developers/download/win/dictionary-demo-mysql.rar">MySQL</a></p> <p class="normal_text"><a href="http://www.solarix.ru/for_developers/download/win/dictionary-demo-mssql.rar">MS SQL</a></p> <p class="normal_text"><a href="http://www.solarix.ru/for_developers/download/win/dictionary-demo-firebird.rar">FireBird</a></p> <p class="normal_text"><a href="http://www.solarix.ru/for_developers/download/win/dictionary-demo-sqlite.rar">SQLite</a></p> <p>Ознакомительная версия для MySQL залита на сайт solarix.ru и доступна через веб-интерфейс на страницах:</p> <p><a href='http://solarix.ru/for_developers/api/russian-noun-declension.shtml'>Склонение существительных в русском языке</a></p> <p><a href='http://solarix.ru/for_developers/api/russian-verb-conjugation.shtml'>Спряжение глаголов</a></p> <p><a href='http://solarix.ru/for_developers/api/russian-adjective-declension.shtml'>Склонение прилагательных</a></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
<enclosure url="http://www.solarix.ru/for_developers/download/win/dictionary-demo-mysql.rar" length="4524720" type="application/x-rar-compressed" /><media:content url="http://www.solarix.ru/for_developers/download/win/dictionary-demo-mysql.rar" fileSize="4524720" type="application/x-rar-compressed" /><itunes:explicit>no</itunes:explicit><itunes:subtitle> Способ формирования ознакомительных версий SQL словаря переработан таким образом, чтобы получался словарь с 10000 самых частотных словарных статей. Прежние ознакомительные версии содержали словарные статьи на одну (или несколько) определенных букв. Ссылк</itunes:subtitle><itunes:summary> Способ формирования ознакомительных версий SQL словаря переработан таким образом, чтобы получался словарь с 10000 самых частотных словарных статей. Прежние ознакомительные версии содержали словарные статьи на одну (или несколько) определенных букв. Ссылки на новые ознакомительные версии для нескольких моделей СУБД: MySQL MS SQL FireBird SQLite Ознакомительная версия для MySQL залита на сайт solarix.ru и доступна через веб-интерфейс на страницах: Склонение существительных в русском языке Спряжение глаголов Склонение прилагательных -- Delivered by Feed43 service </itunes:summary></item>
<item>
<guid isPermaLink="false">19f1722a1a8ad5286e1a65d7cd93ed54</guid>
<title>Документация по SQL словарю</title>
<description><![CDATA[</p> <p>На сайт добавлена страница с первым вводным уроком по использованию словарной базы русской морфологии:</p> <p><a href='http://www.solarix.ru/russian_grammar_dictionary/sql_dictionary_word_lookup.shtml'>SQL запросы для поиска слов в словарной базе данных</a></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">93ef7435f64aeb5a4ee234a67f7f11b0</guid>
<title>Утилита DumpNGrams под Linux</title>
<description><![CDATA[</p> <p>В дистрибутив SDK версии 10 для Windows и для Linux добавлена утилита DumpNGrams.</p> <p>Это консольная программа, выгружающая данные из базы N-грамм в текстовые файлы формата csv. Она поддерживает оба вида БД N-грамм - в реляционном хранилище (SQLite,MySQL) и NoSQL движок для накопления сотен миллионов записей.</p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">c99252edaeccc4204073073e1b700439</guid>
<title>Функции API для глубокой нормализации</title>
<description><![CDATA[</p> <p>Добавлена документация по двум функциям <a href='http://solarix.ru/for_developers/news/for_developers/api/grammar-engine-api.shtml'>процедурного API</a>, выполняющим <a href='http://solarix.ru/for_developers/docs/text-normalization.shtml'>глубокую нормализацию текста</a>:</p> <p><a href='http://solarix.ru/api/ru/sol_TranslateToNoun.shtml'>sol_TranslateToNoun</a> - приведение к однокоренному существительному, например <i>чайный-чай</i>.</p> <p><a href='http://solarix.ru/api/ru/sol_TranslateToInfinitive.shtml'>sol_TranslateToInfinitive</a> - приведение к однокоренному инфинитиву, например <i>чай-чаёвничать</i></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">b25c56f7494f6e5954a2451f4ed7dc77</guid>
<title>Планы развития для версии 11</title>
<description><![CDATA[</p> <p>В целом версия 11 грамматического движка будет предоставлять больше выразительных средств для описания некоторых языковых явлений, важных для выполнения морфологического и синтаксического анализа. Краткий список намеченных работ включает в себя следующее.</p> <p>1. Корректный учет ёфикации в случаях, когда анализируемое слово написано через ё и это позволяет однозначно разрешить совпадение форм, например <i>осёл - осел</i> или <i>берёт - берет</i>.</p> <p>2. Новый модуль разрешения омонимии в словосочетаниях, когда необходимо привлечение внеграмматических знаний. К примеру, можно сравнить словосочетания <i>кошка спала</i> (от спать) и <i>напряжение спало</i> (стать).</p> <p>3. В дополнение к предыдущему пункту - база знаний, состоящая из фактов и правил логического вывода и обобщения, позволяющая работать с неоднозначностями в тексте.</p> <p>4. Переработка движка слогоделителя. Новый слогоделитель должен предоставлять удобные выразительные средства для описания правил деления на слоги не только для русского языка, но и как минимум для английского.</p> <p>5. Расширение токенизатора. В частности, токенизатор должен передавать морфологическому анализатору информацию, позволяющую различать роль символа - в паттернах <i>человек-паук</i> и <i>кошка - зверь</i>.</p> <p>6. Учет статистики при распознавании слов с опечатками.</p> <p>Запланированные работы, не связанные непосредственно с грамматикой:</p> <p>1. Расширенный формат строки подключения для SQLite в файле конфигурирования словаря, с заданием режима read-only и другими необходимыми параметрами открытия БД.</p> <p>2. Классы доступа к словарной БД в MSSQL.</p> <p>3. PHP-модуль для доступа к словарной базе через процедурный API движка.</p> <p>4. Сборка SDK Грамматического Словаря для MacOS X.</p> <p>Кроме того, план работ включает ряд "количественных" пунктов, связанных с расширением уже имеющихся функций.</p> <p>1. Правила морфологического анализа для русского и английского языка.</p> <p>2. Синтаксический анализатор для английского языка.</p> <p>3. Русский лексикон - новые словарные статьи, простановка ёфикации и ударений, дополнительные правила морфологического анализа неизвестных слов.</p> <p>4. Новые правила распознавания "типичных опечаток", в качестве примера: <i>мне кажет<b>ь</b>ся</i>.</p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">3105dabd38a5972167fdd9b9734cd091</guid>
<title>SDK Синонимизатора v.10.27</title>
<description><![CDATA[</p> <p>Все компоненты собраны и протестированы. В комплект входит текущая сборка морфологического модуля и словарь синонимов. Дополнительно собран ознакомительный вариант SDK, содержащий урезанный вариант словаря с меньшим количеством словарных статей и синонимов. В его состав входит консольная версия синонимизатора для Win32, dll синонимизатора, исходники программы Rewriter и еще пара примеров вызова API на C++, C# и Delphi.</p> <p> <img src='http://solarix.ru/pix/download.gif'/> <a href="http://solarix.ru/for_developers/download/win/sdk-synonymizer-demo.exe">скачать ознакомительную версию SDK синонимизатора для Windows 32 бита (16 Мб)</a> </p> <p> <img src='http://solarix.ru/pix/download.gif'/> <a href="http://solarix.ru/for_developers/download/win/joker.rar">GUI версия демо синонимизатора для Windows 32 бита (32 Мб)</a> </p> <p><a href='http://solarix.ru/synonymizer.shtml'>Полная версия SDK синонимизатора</a> содержит инструменты и файлы данных для пересборки словаря, в том числе для добавления своих синонимов и слов.</p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
<enclosure url="http://solarix.ru/for_developers/download/win/sdk-synonymizer-demo.exe" length="16927770" type="application/octet-stream" /><media:content url="http://solarix.ru/for_developers/download/win/sdk-synonymizer-demo.exe" fileSize="16927770" type="application/octet-stream" /><itunes:explicit>no</itunes:explicit><itunes:subtitle> Все компоненты собраны и протестированы. В комплект входит текущая сборка морфологического модуля и словарь синонимов. Дополнительно собран ознакомительный вариант SDK, содержащий урезанный вариант словаря с меньшим количеством словарных статей и синоним</itunes:subtitle><itunes:summary> Все компоненты собраны и протестированы. В комплект входит текущая сборка морфологического модуля и словарь синонимов. Дополнительно собран ознакомительный вариант SDK, содержащий урезанный вариант словаря с меньшим количеством словарных статей и синонимов. В его состав входит консольная версия синонимизатора для Win32, dll синонимизатора, исходники программы Rewriter и еще пара примеров вызова API на C++, C# и Delphi. скачать ознакомительную версию SDK синонимизатора для Windows 32 бита (16 Мб) GUI версия демо синонимизатора для Windows 32 бита (32 Мб) Полная версия SDK синонимизатора содержит инструменты и файлы данных для пересборки словаря, в том числе для добавления своих синонимов и слов. -- Delivered by Feed43 service </itunes:summary></item>
<item>
<guid isPermaLink="false">fcb71317dd3b9027bbd7421046e19509</guid>
<title>Обновления ознакомительных версий SDK</title>
<description><![CDATA[</p> <p>Собраны с текущим набором правил морфологического и синтаксического анализа и выложены на сайте бесплатные ознакомительные версии SDK Грамматического Словаря:</p> <p class="normal_text"> <img src='http://solarix.ru/pix/download.gif'/> <a href="http://solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe">Windows 32 бита (20 Мб)</a> </p> <p class="normal_text"> <img src='http://solarix.ru/pix/download.gif'/> <a href="http://solarix.ru/for_developers/download/lin/libgren-demo.tar.bz2">Linux 32 бита (30 Мб)</a> </p> <p class="normal_text"> <img src='http://solarix.ru/pix/download.gif'/> <a href="http://solarix.ru/for_developers/download/lin/libgren64-demo.tar.bz2">Linux 64 бита (31 Мб)</a> </p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
<enclosure url="http://solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe" length="20501461" type="application/octet-stream" /><media:content url="http://solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe" fileSize="20501461" type="application/octet-stream" /><itunes:explicit>no</itunes:explicit><itunes:subtitle> Собраны с текущим набором правил морфологического и синтаксического анализа и выложены на сайте бесплатные ознакомительные версии SDK Грамматического Словаря: Windows 32 бита (20 Мб) Linux 32 бита (30 Мб) Linux 64 бита (31 Мб) -- Delivered by Feed43 serv</itunes:subtitle><itunes:summary> Собраны с текущим набором правил морфологического и синтаксического анализа и выложены на сайте бесплатные ознакомительные версии SDK Грамматического Словаря: Windows 32 бита (20 Мб) Linux 32 бита (30 Мб) Linux 64 бита (31 Мб) -- Delivered by Feed43 service </itunes:summary></item>
<item>
<guid isPermaLink="false">61f16d6be95be0bacaae21329739049a</guid>
<title>Обновление Morphology</title>
<description><![CDATA[</p> <p>В новой версии <a href='http://solarix.ru/morphology.shtml'>программы Morphology</a> сделаны следующие изменения:</p> <p>1. Лексикон расширен до полного <a href='http://solarix.ru/for_developers/news/state.shtml'>размера</a>, имеющегося в <a href='http://solarix.ru/grammatical-dictionary-api.shtml'>коммерческой версии SDK</a>.</p> <p>2. Синтаксический и морфологический анализаторы собраны по текущему набору правил, то есть в нем теперь есть правила для разбора многих конструкций глагольного сказуемого и связок.</p> <p>Инсталлятор для Windows размером 22 Мб можно <a href='http://solarix.ru/for_developers/download/win/morphology-setup.exe'>скачать по этой ссылке</a>.</p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
<enclosure url="http://solarix.ru/for_developers/download/win/morphology-setup.exe" length="23257577" type="application/octet-stream" /><media:content url="http://solarix.ru/for_developers/download/win/morphology-setup.exe" fileSize="23257577" type="application/octet-stream" /><itunes:explicit>no</itunes:explicit><itunes:subtitle> В новой версии программы Morphology сделаны следующие изменения: 1. Лексикон расширен до полного размера, имеющегося в коммерческой версии SDK. 2. Синтаксический и морфологический анализаторы собраны по текущему набору правил, то есть в нем теперь есть п</itunes:subtitle><itunes:summary> В новой версии программы Morphology сделаны следующие изменения: 1. Лексикон расширен до полного размера, имеющегося в коммерческой версии SDK. 2. Синтаксический и морфологический анализаторы собраны по текущему набору правил, то есть в нем теперь есть правила для разбора многих конструкций глагольного сказуемого и связок. Инсталлятор для Windows размером 22 Мб можно скачать по этой ссылке. -- Delivered by Feed43 service </itunes:summary></item>
<item>
<guid isPermaLink="false">3e2c502fb45be483660c950ee45c0958</guid>
<title>Документация</title>
<description><![CDATA[</p> <p>Добавлены или обновлены описания <a href='http://solarix.ru/api/ru/list.shtml'>функций процедурного API</a> синтаксического анализатора:</p> <p><a href='http://solarix.ru/api/ru/sol_GetNodeVerPairState.shtml'>sol_GetNodeVerPairState</a></p> <p><a href='http://solarix.ru/api/ru/sol_GetNodeVerCoordPair.shtml'>sol_GetNodeVerCoordPair</a></p> <p><a href='http://solarix.ru/api/ru/sol_GetNodePairCoord.shtml'>sol_GetNodePairCoord</a></p> <p><a href='http://solarix.ru/api/ru/sol_GetNodePairState.shtml'>sol_GetNodePairState</a></p> <p><a href='http://solarix.ru/api/ru/sol_GetNodePairsCount.shtml'>sol_GetNodePairsCount</a></p> <p><a href='http://solarix.ru/api/ru/sol_GetNodeVerCoordState.shtml'>sol_GetNodeVerCoordState</a></p> <p><a href='http://solarix.ru/api/ru/sol_GetNodeCoordState.shtml'>sol_GetNodeCoordState</a></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">456908ce91ff45bdd86400d94de0bf12</guid>
<title>Обновление с деепричастиями</title>
<description><![CDATA[</p> <p>В новом синтаксическом анализаторе завершены работы над правилами для деепричастных оборотов.</p> <p>В состав ознакомительной версии SDK для Linux добавлена утилита syntax и скрипты для запуска ее в интерактивном режиме.</p> <p>Ссылки для скачивания новых версий ознакомительного SDK можно найти <a href='http://solarix.ru/grammatical-dictionary-api.shtml'>здесь</a>.</p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">65746a0a680a2e989dd3336edab9cb53</guid>
<title>Обновление ознакомительной версии SDK</title>
<description><![CDATA[</p> <p>SDK собран по текущей версии лексикона и анализаторов.</p> <p>В состав добавлены утилиты <a href='http://solarix.ru/for_developers/exercise/morphology-analysis.shtml#wdebugger'>Debugger</a> и <a href='http://solarix.ru/for_developers/exercise/la_project.shtml'>Empirika</a>.</p> <p>После установки в папке ...\scripts можно найти скрипты для запуска в консоли морфологического разбора предложения console-morphology.cmd, синтаксического разбора console-syntax.cmd, сборки частотной статистики для текстов в папке freq-ru.cmd, сборки базы N-грамм ngram-ru.cmd.</p> <p class="normal_text"> <img src='http://solarix.ru/pix/download.gif'/> <a href="http://solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe">Windows 32 бита (19 Мб)</a> </p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
<enclosure url="http://solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe" length="20421257" type="application/octet-stream" /><media:content url="http://solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe" fileSize="20421257" type="application/octet-stream" /><itunes:explicit>no</itunes:explicit><itunes:subtitle> SDK собран по текущей версии лексикона и анализаторов. В состав добавлены утилиты Debugger и Empirika. После установки в папке ...\scripts можно найти скрипты для запуска в консоли морфологического разбора предложения console-morphology.cmd, синтаксическ</itunes:subtitle><itunes:summary> SDK собран по текущей версии лексикона и анализаторов. В состав добавлены утилиты Debugger и Empirika. После установки в папке ...\scripts можно найти скрипты для запуска в консоли морфологического разбора предложения console-morphology.cmd, синтаксического разбора console-syntax.cmd, сборки частотной статистики для текстов в папке freq-ru.cmd, сборки базы N-грамм ngram-ru.cmd. Windows 32 бита (19 Мб) -- Delivered by Feed43 service </itunes:summary></item>
<item>
<guid isPermaLink="false">2b489e770b49ecfa7eadbd87e372052a</guid>
<title>Обновления ознакомительных версий SDK</title>
<description><![CDATA[</p> <p>Сделана ревизия состава ознакомительных версий SDK грамматического словаря. Входящий в их состав лексикон немного расширен, добавлен еще один простой пример работы с процедурным API на C++ (см. папку .../demo/ai/solarix/Grammar_Engine/SimpleGREN). Исходный текст этого примера приведен на <a href='http://solarix.ru/api/ru/sol_ProjectWord.shtml'>странице</a> в качестве пояснения для функции sol_ProjectWord.</p> <p class="normal_text"> <img src='http://solarix.ru/pix/download.gif'/> <a href="http://solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe">Windows 32 бита (15 Мб)</a> </p> <p class="normal_text"> <img src='http://solarix.ru/pix/download.gif'/> <a href="http://solarix.ru/for_developers/download/lin/libgren-demo.tar.bz2">Linux 32 бита (28 Мб)</a> </p> <p class="normal_text"> <img src='http://solarix.ru/pix/download.gif'/> <a href="http://solarix.ru/for_developers/download/lin/libgren64-demo.tar.bz2">Linux 64 бита (28 Мб)</a> </p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
<enclosure url="http://solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe" length="20501461" type="application/octet-stream" /><media:content url="http://solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe" fileSize="20501461" type="application/octet-stream" /><itunes:explicit>no</itunes:explicit><itunes:subtitle> Сделана ревизия состава ознакомительных версий SDK грамматического словаря. Входящий в их состав лексикон немного расширен, добавлен еще один простой пример работы с процедурным API на C++ (см. папку .../demo/ai/solarix/Grammar_Engine/SimpleGREN). Исходн</itunes:subtitle><itunes:summary> Сделана ревизия состава ознакомительных версий SDK грамматического словаря. Входящий в их состав лексикон немного расширен, добавлен еще один простой пример работы с процедурным API на C++ (см. папку .../demo/ai/solarix/Grammar_Engine/SimpleGREN). Исходный текст этого примера приведен на странице в качестве пояснения для функции sol_ProjectWord. Windows 32 бита (15 Мб) Linux 32 бита (28 Мб) Linux 64 бита (28 Мб) -- Delivered by Feed43 service </itunes:summary></item>
<item>
<guid isPermaLink="false">af642b882ed57c728742f463ed9b3c0d</guid>
<title>Обновления демо SDK и Morphology</title>
<description><![CDATA[</p> <p>1. Собрана ознакомительная версия SDK грамматического словаря с текущим вариантом синтаксического анализатора: <a href="http://solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe">скачать</a> (Win32, 16 Мб).</p> <p>Для использования нового алгоритма синтаксического анализа нужно при вызове из прикладного кода функции <a href="http://solarix.ru/api/ru/sol_SyntaxAnalysis.shtml">sol_SyntaxAnalysis</a> указать для аргумента SyntacticFlags значение 2. Работу этого синтаксического анализатора можно визуально оценить на сайте онлайн-словаря, перейдя по ссылкам:</p> <p><i><a href='http://178.64.252.139:8080/Morphology.aspx?SyntaxTree=1&phrase=%d0%91%d0%be%d0%bb%d1%8c%d1%88%d0%be%d0%b9+%d0%ba%d0%be%d1%82+%d1%81%d0%bb%d0%b0%d0%b4%d0%ba%d0%be+%d1%81%d0%bf%d0%b8%d1%82+%d0%bd%d0%b0+%d1%81%d1%82%d0%b0%d1%80%d0%be%d0%bc+%d0%ba%d0%be%d0%b6%d0%b0%d0%bd%d0%be%d0%bc+%d0%b4%d0%b8%d0%b2%d0%b0%d0%bd%d0%b5'>Большой кот сладко спит на старом кожаном диване</a></i></p> <p><i><a href='http://178.64.252.139:8080/Morphology.aspx?SyntaxTree=1&phrase=%d0%bf%d1%8e%d1%80%d0%b5+%d0%b1%d1%8b%d0%bb%d0%be+%d0%b2%d0%ba%d1%83%d1%81%d0%bd%d0%be%d0%b5%2c+%d0%bf%d1%83%d1%81%d1%82%d1%8c+%d0%b8+%d0%b2%d1%87%d0%b5%d1%80%d0%b0%d1%88%d0%bd%d0%b5%d0%b5'>пюре было вкусное, пусть и вчерашнее</a></i></p> <p><i><a href='http://178.64.252.139:8080/Morphology.aspx?SyntaxTree=1&phrase=%d0%9f%d0%bb%d0%b0%d0%bd%d0%b5%d1%82%d0%b0+%d0%ae%d0%bf%d0%b8%d1%82%d0%b5%d1%80+%d0%b2%d0%b8%d0%b4%d0%bd%d0%b0+%d0%bd%d0%b5%d0%b2%d0%be%d0%be%d1%80%d1%83%d0%b6%d0%b5%d0%bd%d0%bd%d1%8b%d0%bc+%d0%b3%d0%bb%d0%b0%d0%b7%d0%be%d0%bc'>Планета Юпитер видна невооруженным глазом</a></i></p> <p><i><a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d0%90%d0%bd%d1%82%d0%be%d0%bd%d0%b8%d0%be+%d0%b1%d1%8b%d0%bb+%d1%85%d0%be%d1%82%d1%8f+%d0%b8+%d1%81%d1%82%d1%80%d0%be%d0%b3%2c+%d0%bd%d0%be+%d1%81%d0%bf%d1%80%d0%b0%d0%b2%d0%b5%d0%b4%d0%bb%d0%b8%d0%b2'>Антонио был хотя и строг, но справедлив</a></i></p> <p><i><a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d0%a1%d1%83%d0%b4%d1%8c%d0%b8+%d0%b1%d1%8b%d0%bb%d0%b8+%d1%81%d1%82%d1%80%d0%be%d0%b3%d0%b8%2c+%d0%bd%d0%be+%d0%bd%d0%b5%d0%bf%d0%be%d0%b4%d0%ba%d1%83%d0%bf%d0%bd%d1%8b+%d0%b8+%d1%81%d0%bf%d1%80%d0%b0%d0%b2%d0%b5%d0%b4%d0%bb%d0%b8%d0%b2%d1%8b'>Судьи были строги, но неподкупны и справедливы</a></i></p> <p>2. Обновлена оконная <a href='http://solarix.ru/morphology.shtml'>программа Morphology</a> для тестирования морфологического анализатора - <a href="http://solarix.ru/for_developers/download/win/morphology-setup.exe">скачать</a> (Win, 18 Мб).</p> <p>3. Обновлен исходный текст файла <a href="http://solarix.ru/for_developers/download/archive/grammar_engine_api.cpp">grammar_engine_api.cpp</a> (160 Кб) с C++ кодом экспорта <a href='http://solarix.ru/for_developers/api/grammar-engine-api.shtml'>процедурного API</a>.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
<enclosure url="http://solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe" length="16657384" type="application/octet-stream" /><media:content url="http://solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe" fileSize="16657384" type="application/octet-stream" /><itunes:explicit>no</itunes:explicit><itunes:subtitle> 1. Собрана ознакомительная версия SDK грамматического словаря с текущим вариантом синтаксического анализатора: скачать (Win32, 16 Мб). Для использования нового алгоритма синтаксического анализа нужно при вызове из прикладного кода функции sol_SyntaxAnaly</itunes:subtitle><itunes:summary> 1. Собрана ознакомительная версия SDK грамматического словаря с текущим вариантом синтаксического анализатора: скачать (Win32, 16 Мб). Для использования нового алгоритма синтаксического анализа нужно при вызове из прикладного кода функции sol_SyntaxAnalysis указать для аргумента SyntacticFlags значение 2. Работу этого синтаксического анализатора можно визуально оценить на сайте онлайн-словаря, перейдя по ссылкам: Большой кот сладко спит на старом кожаном диване пюре было вкусное, пусть и вчерашнее Планета Юпитер видна невооруженным глазом Антонио был хотя и строг, но справедлив Судьи были строги, но неподкупны и справедливы 2. Обновлена оконная программа Morphology для тестирования морфологического анализатора - скачать (Win, 18 Мб). 3. Обновлен исходный текст файла grammar_engine_api.cpp (160 Кб) с C++ кодом экспорта процедурного API. -- Delivered by Feed43 service </itunes:summary></item>
<item>
<guid isPermaLink="false">1dc6e6023e59b5fe5ee7957a3182b7d6</guid>
<title>Обновление демо SDK</title>
<description><![CDATA[</p> <p>Обновлена ознакомительная версия SDK Грамматического Словаря:</p> <p><a href='http://files.solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe'>Скачать архив для Win32 (16 Мб)</a></p> <p>Основное изменение - в дистрибутив включены примеры выполнения основных действий на C++ и C# (см. содержимое папки ...\demo\ai\solarix\Grammar_Engine).</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
<enclosure url="http://files.solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe" length="16560005" type="application/octet-stream" /><media:content url="http://files.solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe" fileSize="16560005" type="application/octet-stream" /><itunes:explicit>no</itunes:explicit><itunes:subtitle> Обновлена ознакомительная версия SDK Грамматического Словаря: Скачать архив для Win32 (16 Мб) Основное изменение - в дистрибутив включены примеры выполнения основных действий на C++ и C# (см. содержимое папки ...\demo\ai\solarix\Grammar_Engine). -- Deliv</itunes:subtitle><itunes:summary> Обновлена ознакомительная версия SDK Грамматического Словаря: Скачать архив для Win32 (16 Мб) Основное изменение - в дистрибутив включены примеры выполнения основных действий на C++ и C# (см. содержимое папки ...\demo\ai\solarix\Grammar_Engine). -- Delivered by Feed43 service </itunes:summary></item>
<item>
<guid isPermaLink="false">c3cfe6776062ddb20be8e1a9208be283</guid>
<title>Обновление документации по морфоанализатору</title>
<description><![CDATA[</p> <p>Выложены описания части функций морфологического и синтаксического анализатора:</p> <p class="normal_text"><a href='http://solarix.ru/for_developers/news/sol_MorphologyAnalysis.shtml'>sol_MorphologyAnalysis</a> - морфологический разбор предложения</p> <p class="normal_text"><a href='http://solarix.ru/for_developers/news/sol_DeleteResPack'>sol_DeleteResPack</a> - удаление результатов анализа</p> <p class="normal_text"><a href='http://solarix.ru/for_developers/news/sol_CountGrafs'>sol_CountGrafs</a> - количество альтернативных наборов синтаксических графов</p> <p class="normal_text"><a href='http://solarix.ru/for_developers/news/sol_CountRoots'>sol_CountRoots</a> - количество корневых узлов</p> <p class="normal_text"><a href='http://solarix.ru/for_developers/news/sol_GetRoot'>sol_GetRoot</a> - получение корневого узла</p> <p class="normal_text"><a href='http://solarix.ru/for_developers/news/sol_CountLeafs'>sol_CountLeafs</a> - количество дочерних узлов</p> <p class="normal_text"><a href='http://solarix.ru/for_developers/news/sol_GetLeaf'>sol_GetLeaf</a> - получение дочернего узла</p> <p>Исходный текст API на C++ - файл <a href='http://solarix.ru/for_developers/download/archive/grammar_engine_api.cpp'>grammar_engine_api.cpp</a>.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">7f01a2f7b578a6b12828deec48ffdc1d</guid>
<title>Обновление алгоритма лемматизатора</title>
<description><![CDATA[</p> <p>В матмодели поправлены некоторые параметры, влияющие на процесс обучения лемматизатора. В результате файл базы данных с правилами уменьшился в два раза для одноязычного русского словаря, улучшилась обработка не-словарных слов.</p> <p><a href='http://solarix.ru/for_developers/api/lemmatizator-api.shtml'>Полное описание API лемматизатора</a></p> <p>Потестировать работу нового лемматизатора можно в онлайне <a href='http://178.64.252.139:8080/Lemmatization.aspx'>здесь</a> (тестовый сервер обычно доступен в рабочие часы по Москве).</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">f347862b0697cb4872ebfea02671f4ea</guid>
<title>Обновление русской морфологии online</title>
<description><![CDATA[</p> <p>1. Расширен русский лексикон. Как можно убедиться на <a href='http://178.64.252.139:8080/Statistics.aspx'>странице online статистики</a>, сейчас в русском разделе примерно 145 тысяч словарных статей, 1.8 млн. грамматических форм или около 1.1 миллиона уникальных слов. В базу данных online словаря для тестирования временно залит билингвальный русско-английский словарь, с <a href='http://solarix.ru/for_developers/docs/morphology_analyzer.shtml'>морфологическими анализаторами</a> для обоих языков.</p> <p>Доработан алгоритм нечеткого поиска слов с опечатками. Теперь анализатор по возможности оставляет среди вариантов только известные ему слова, и лишь при невозможности такого выбора использует "кванторные" эрзац-слова. Например, в трех нижеприведенных предложениях (по ссылке можно попасть на страницу online анализатора) можно увидеть, что прилагательное распознано однозачно как 'мистический', так как других вариантов нет:</p> <p> <a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d0%bc%d1%8b+%d1%81%d0%bc%d0%be%d1%82%d1%80%d0%b8%d0%bc+%d0%bc%d1%8b%d1%81%d1%82%d0%b8%d1%87%d0%b5%d1%81%d0%ba%d0%b8%d0%b9+%d1%82%d1%80%d0%b8%d0%bb%d0%bb%d0%b5%d1%80'>мы смотрим мыстический триллер</a><br> <a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d0%bc%d1%8b+%d1%81%d0%bc%d0%be%d1%82%d1%80%d0%b8%d0%bc+%d0%bc%d0%b8%d0%b8%d1%81%d1%82%d0%b8%d1%87%d0%b5%d1%81%d0%ba%d0%b8%d0%b9+%d1%82%d1%80%d0%b8%d0%bb%d0%bb%d0%b5%d1%80'>мы смотрим миистический триллер</a><br> <a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d0%bc%d1%8b+%d1%81%d0%bc%d0%be%d1%82%d1%80%d0%b8%d0%bc+%d0%bc%d0%b8%d1%81%d1%82%d0%b8%d1%87%d1%81%d0%ba%d0%b8%d0%b9+%d1%82%d1%80%d0%b8%d0%bb%d0%bb%d0%b5%d1%80'>мы смотрим мистичский триллер</a><br> </p> <p>В морфологический анализатор добавлена возможность работы с несловарными именами собственными, написанными латиницей:</p> <p><a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d0%9a%d0%be%d1%80%d0%bf%d0%be%d1%80%d0%b0%d1%86%d0%b8%d1%8f+Microsoft+%d0%be%d0%b1%d1%8a%d1%8f%d0%b2%d0%b8%d0%bb%d0%b0+%d0%be+%d0%bd%d0%b0%d1%87%d0%b0%d0%bb%d0%b5+%d1%80%d0%b0%d0%b7%d1%80%d0%b0%d0%b1%d0%be%d1%82%d0%ba%d0%b8+%d0%bd%d0%be%d0%b2%d0%be%d0%b9+%d0%be%d0%bf%d0%b5%d1%80%d0%b0%d1%86%d0%b8%d0%be%d0%bd%d0%bd%d0%be%d0%b9+%d1%81%d0%b8%d1%81%d1%82%d0%b5%d0%bc%d1%8b'>Корпорация Microsoft объявила о начале разработки новой операционной системы</a></p> <p>В этом примере можно увидеть (покликав в результатах морфологического разбора на желтые блоки слов), что слово <i>системы</i> однозначно распознано как существительное в родительном падеже единственного числа, хотя есть омонимичная ему форма множественного числа именительного и винительного падежа. Собственно говоря, именно способность отбросить грамматически недопустимые омонимичные формы и используется при <a href='http://www.solarix.ru/for_developers/api/morphological_test_patterns.shtml'>тестировании морфоанализатора с помощью пакетных тестов</a>.</p> <p>Аналогичная возможность опробована и в английском морфологическом анализаторе. Конечно, английский морфоанализатор основан на том же ядре, что и русский, только подгружает свой набор правил. Для примера можно посмотреть на результаты морфологического разбора такого предложения (это название книги, взято просто для примера, в котором имя собственное Greenspan отсутствует в лексиконе):</p> <p> <a href="http://178.64.252.139:8080/Morphology.aspx?phrase=Greenspan's+fraud%3a+how+two+decades+of+his+policies+have+undermined+the+global+economy">Greenspan's fraud: how two decades of his policies have undermined the global economy</a> </p> <p>Схема <a href='http://solarix.ru/sql-dictionary-sdk.shtml'>SQL словаря</a> для MySQL доработана. В частности, в таблицу <b>lang_alphabet</b> добавлен столбец <b>ordering</b> для явного обозначения основного <a href='http://solarix.ru/for_developers/docs/alphabet.shtml'>алфавита</a> языка, чтобы латиница, допустимая и для русского языка, все-таки преимущественного относилась к английскому. Кроме того, скрипт генерации словаря теперь создает все необходимые ограничения foreign key.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">dba747555571e563d25549513b873be0</guid>
<title>Обновление offline-версии морфологического анализатора</title>
<description><![CDATA[</p> <p>На сайте выложена новая сборка бесплатной <a href="http://www.solarix.ru/morphology.shtml">программы Morphology</a>.</p> <p>Она выполняет морфологический разбор предложений и показывает основную грамматическую информацию - <a href='http://www.solarix.ru/for_developers/docs/classes.shtml'>часть речи</a>, <a href='http://www.solarix.ru/grammar/case.shtml'>падеж</a>, <a href='http://www.solarix.ru/grammar/gender.shtml'>род</a>, <a href='http://www.solarix.ru/grammar/number.shtml'>число</a>, <a href='http://www.solarix.ru/grammar/aspect.shtml'>вид</a>, <a href='http://www.solarix.ru/grammar/tense.shtml'>время</a> и так далее.</p> <p>Ее работа основана на демонстрационной версии <a href='http://www.solarix.ru/for_developers/api/grammar-engine.shtml'>DLL грамматического движка</a>. Относительно полной версии данный вариант имеет небольшие ограничения в плане работы с <a href='http://www.solarix.ru/for_developers/docs/sg.shtml'>лексиконом</a> и <a href='http://www.solarix.ru/for_developers/docs/thesaurus.shtml'>тезаурусом</a>. Кроме того, программа комплектуется несколько урезанным русским словарем.</p> <p>Функционально программа почти полностью аналогична <a href='http://178.64.252.139:8080/Morphology.aspx'>онлайн-версии морфоанализатора</a>, но не требует доступа к серверу грамматического словаря.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">ae6e6b9ecd6b26233c4da9fbfe6eb3e5</guid>
<title>Изменения в морфологическом анализаторе</title>
<description><![CDATA[</p> <p>Новая ревизия 10.10 выложена на онлайн-сервере. Главное изменение сделано в алгоритме морфологического разбора предложений. Теперь в правилах анализа можно работать не только со словарными статьями, но и с вне-словарными единицами текста. К примеру, в правилах можно задавать наборы произвольных слов и сопоставлять слова с регулярными выражениями. Это позволит работать с различными названиями, включая наименования фирм, товаров и так далее. В качестве проверки концепции можно посмотреть на анализ фраз</p> <p><a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d0%bd%d0%b0+%d1%8d%d1%82%d0%be%d0%b9+%d1%83%d0%b4%d0%b8%d0%b2%d0%b8%d1%82%d0%b5%d0%bb%d1%8c%d0%bd%d0%be+%d1%87%d0%b5%d1%82%d0%ba%d0%be%d0%b9+%d1%84%d0%be%d1%82%d0%be%d0%b3%d1%80%d0%b0%d1%84%d0%b8%d0%b8+%d0%bc%d0%be%d0%b6%d0%bd%d0%be+%d1%83%d0%b2%d0%b8%d0%b4%d0%b5%d1%82%d1%8c+%d1%80%d0%b0%d1%81%d1%81%d0%b5%d1%8f%d0%bd%d0%bd%d0%be%d0%b5+%d1%81%d0%ba%d0%be%d0%bf%d0%bb%d0%b5%d0%bd%d0%b8%d0%b5+NGC+884'>на этой удивительно четкой фотографии можно увидеть рассеянное скопление NGC 884</a></p> <p><a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d0%bd%d0%b0+%d1%84%d0%be%d1%82%d0%be%d0%b3%d1%80%d0%b0%d1%84%d0%b8%d0%b8+%d0%bc%d0%be%d0%b6%d0%bd%d0%be+%d1%83%d0%b2%d0%b8%d0%b4%d0%b5%d1%82%d1%8c+%d1%81%d0%bf%d0%b8%d1%80%d0%b0%d0%bb%d1%8c%d0%bd%d1%83%d1%8e+%d0%b3%d0%b0%d0%bb%d0%b0%d0%ba%d1%82%d0%b8%d0%ba%d1%83+M31'>на фотографии можно увидеть спиральную галактику M31</a></p> <p>В качестве не-словарных элементов, на которые можно ссылаться в правилах, могут выступать также словосочетания. Сейчас для проверки добавлено распознавание нескольких вводных словосочетаний, к примеру:</p> <p><a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d0%9d%d0%b5%d1%82+%d0%bd%d0%b8%d0%ba%d0%b0%d0%ba%d0%b8%d1%85+%d1%81%d0%be%d0%bc%d0%bd%d0%b5%d0%bd%d0%b8%d0%b9%2c+%d1%87%d1%82%d0%be+%d1%8f+%d0%bf%d0%be%d0%b3%d0%be%d0%b2%d0%be%d1%80%d1%8e+%d1%81+%d0%90%d0%bd%d1%82%d0%be%d0%bd%d0%b8%d0%be+%d0%b8+%d0%ad%d0%bb%d0%b5%d0%be%d0%bd%d0%be%d1%80'>Нет никаких сомнений, что я поговорю с Антонио и Элеонор</a></p> <p>Еще одно важное нововведение - расширение алгоритма нечеткого поиска слов. Теперь он умеет работать с <i>распространенными опечатками</i>, то есть со словами, которые часто пишутся неправильно либо по ошибке, либо намеренно. Таким образом, вместо внесения в лексикон ненормативных словарных форм и опоры на возможности определения морфологических категорий не-словарных текстовых единиц, мы можем явно обучать морфоанализатор распознавать их. Для проверки в словарь введено несколько таких слов, к примеру:</p> <p><a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d0%ba%d0%be%d1%88%d0%ba%d0%b8+%d1%81%d0%bf%d1%8f%d1%82%2c+%d0%bf%d0%b0%d1%82%d0%b0%d0%bc%d1%83%d1%88%d1%82%d0%b0+%d0%be%d0%bd%d0%b8+%d0%bf%d0%be%d0%b9%d0%bc%d0%b0%d0%bb%d0%b8+%d1%82%d1%8b%d1%89%d1%83+%d0%bc%d1%8b%d1%88%d0%b5%d0%ba'>кошки спят, патамушта они поймали тыщу мышек</a></p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">b625a36a91ca8a8a93760e4b3ef20d9c</guid>
<title>Ревизия 10.09 русской морфологии</title>
<description><![CDATA[</p> <p>На сервере выложена новая серверная версия грамматического словаря.</p> <p>Внесено много дополнений и правок в лексикон и морфологический анализатор русских предложений. Далее по ссылкам можно увидеть результаты морфологического разбора некоторых предложений, в том числе и содержащих слова с ошибками, либо несловарные единицы.</p> <p><a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d0%bc%d1%8b+%d0%b7%d0%b0%d0%b3%d0%b0%d1%80%d0%b0%d0%b5%d0%bc+%d0%bf%d0%be%d0%b4+%d1%81%d0%be%d0%bd%d1%86%d0%b5%d0%bc'>мы загараем под сонцем</a></p> <p><a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d0%bf%d1%83%d1%88%d1%8b%d1%81%d1%82%d0%b0%d1%8f+%d0%ba%d0%be%d1%89%d0%ba%d0%b0+%d1%81%d0%bf%d0%b8%d1%82+%d0%bd%d0%b0+%d0%b4%d0%b5%d0%b2%d0%b0%d0%bd%d0%b5'>пушыстая кощка спит на деване</a></p> <p><a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d1%8f+%d0%b2%d0%b8%d0%b6%d1%83+%d0%bf%d1%83%d1%88%d1%8b%d1%81%d1%82%d1%83%d1%8e+%d1%81%d1%83%d0%bf%d0%b5%d1%80%d0%ba%d0%be%d1%88%d0%ba%d1%83'>я вижу пушыстую суперкошку</a></p> <p><a href='http://178.64.252.139:8080/Morphology.aspx?phrase=%d0%b1%d0%b0%d1%80%d0%bc%d0%b0%d0%b3%d0%bb%d0%be%d1%82+%d0%b2%d1%8f%d0%bb%d0%be+%d0%bf%d0%bb%d1%8e%d0%ba%d1%83%d0%b5%d1%82'>бармаглот вяло плюкует</a></p> <p>Сервер с онлайн-словарем доступен примерно с 10 до 18 часов по Москве в рабочие дни.</p> <p>Объем словаря вырос до примерно 136 тысяч словарных статей, или более 1 миллиона уникальных слов.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">a28a625602c7b39e049b59c335e57bc3</guid>
<title>Нечеткий анализ в серверном варианте словаря</title>
<description><![CDATA[</p> <p>1. Войдите на страницу <a href='http://178.64.252.139:8080/Morphology.aspx'>http://178.64.252.139:8080/Morphology.aspx</a></p> <p>2. Введите в поле ввода предложение <i>пушыстая кощка спит на деване</i></p> <p>3. Запустите морфологический анализ.</p> <p>В результатах можно видеть, что анализатор не только определил грамматические признаки слов <i>пушыстая</i>, <i>кощка</i> и <i>деван</i>, но и обоснованно предположил, что это формы прилагательного <i>пушистый</i> , существительного <i>кошка</i> и <i>диван</i>. Кликните на блоке желтого цвета, чтобы получить развернутый отчет о результатах анализа для конкретного слова.</p> <p>Кроме того, видно еще одно нововведение. При внимательном просмотре результатов анализа для слова <i>деван</i> можно заметить, что кроме варианта <i>диван</i> найден также вариант <i>девон</i>, но он идет вторым из-за низкой относительной частоты использования этого слова.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">3417d3bc7914c9cc9805f136be4da7a8</guid>
<title>Обновления в русской морфологии v.10.06</title>
<description><![CDATA[</p> <p>В новый релиз грамматического словаря вошел большой набор изменений, среди которых:</p> <p>1. Новые функции <a href='http://solarix.ru/api/ru/list.shtml'>процедурного API</a>: <a href='http://solarix.ru/api/ru/sol_ListPartsOfSpeech.shtml'>sol_ListPartsOfSpeech</a> - список <a href='http://solarix.ru/for_developers/docs/classes.shtml'>частей речи</a>, <a href='http://solarix.ru/api/ru/sol_GetEntryFreq.shtml'>sol_GetEntryFreq</a> - частотная информация о <a href='http://solarix.ru/for_developers/docs/entries.shtml'>словарной статье</a>, <a href='http://solarix.ru/api/ru/sol_LinksInfoCode.shtml'>sol_LinksInfoCode</a> - тип связи в <a href='http://solarix.ru/for_developers/docs/thesaurus.shtml'>тезаурусе</a>, <a href='http://solarix.ru/api/ru/sol_FindEntryCoordPair.shtml'>sol_FindEntryCoordPair</a> - проверка наличия <a href='http://solarix.ru/for_developers/docs/enums.shtml'>грамматического признака</a> в словарной статье, <a href='http://solarix.ru/api/ru/sol_GenerateWordforms.shtml'>sol_GenerateWordforms</a> - получение грамматической формы по набору морфологических признаков, sol_GetLeafLinkType - определение типа ребра в синтаксическом графе.</p> <p>2. Полностью переписан алгоритм нечеткого распознавания слов в <a href='http://solarix.ru/for_developers/docs/morphology_analyzer.shtml'>морфологическом анализаторе</a>. Теперь он умеет быстро искать слова с пропусками букв, с опечатками и подменой.</p> <p>3. Переработана программа Thesaurus, теперь она использует <a href='http://solarix.ru/for_developers/api/grammar-engine.shtml'>dll процедурного API</a> для доступа к словарной базе.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">008c2418a04f6253dd494abddea47677</guid>
<title>Переработанный модуль стемминга</title>
<description><![CDATA[</p> <p>Полностью переработан алгоритм, генерирующий <a href='http://solarix.ru/for_developers/api/stemmer.shtml'>русский стеммер</a> по информации из <a href='http://solarix.ru/for_developers/docs/sg.shtml'>лексикона</a>. Изменения в стеммере включают в себя:</p> <p>1. Технические моменты - существенно повышено быстродействие.</p> <p>2. Более качественный набор правил усечения за счет того, что при построении происходит анализ промежуточных результатов и итерационное уточнение неточных правил.</p> <p>3. Особенности <a href='http://solarix.ru/for_developers/docs/stemmer-and-russian-verbs.shtml'>русского словоизменения</a> , а именно - учет внутренней флекции.</p> <p>Новая версия стемминга в виде .NET сборки доступна для тестирования на странице <a href='http://178.64.252.139:8080/Stemming.aspx'>http://178.64.252.139:8080/Stemming.aspx</a>.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">7df4e720aa0c955cc87a98c205314fc6</guid>
<title>Онлайн-версия грамматического словаря</title>
<description><![CDATA[</p> <p>В течении августа будет (не всегда) доступен сервер, на котором развернуты практически все части грамматического словаря и синонимизатора. Доступ к серверу - по ссылке <a href='http://solarix.ru/online/server2.html'>http://solarix.ru/online/server2.html</a>.</p> <p>Сервер будет в онлайне обычно в рабочее время по Москве.</p> <p>Для тестирования используйте логин test и пароль test.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">90c30c88fec6c498f5561e6d96c5ff7e</guid>
<title>Обновление API поисковой системы</title>
<description><![CDATA[</p> <p>1. В программный интерфейс поисковой системы добавлены функции <a href="http://solarix.ru/for_developers/api/search-engine-api.shtml#sol_LoadPlugins">sol_LoadPlugins[W,A,8]</a> для загрузки списка <a href="http://solarix.ru/desktop-search-online-help/search-engine-plugins.html">плагинов</a> из заданного каталога. Это может быть удобнее, чем переписывание конфигурационного ini-файла и использование sol_ReadIni.</p> <p>2. В SDK поисковой системы включены все основные плагины, включая те, что обеспечивают <a href="http://solarix.ru/desktop-search-online-help/content-plugins.html">извлечение текста</a> из различных офисных документов и <a href="http://solarix.ru/desktop-search-online-help/unpacker-plugins.html">распаковку архивов</a>. Файлы плагинов вместе с необходимыми дополнительными файлами располагаются в подкаталоге ...\lib\faind-plugins.</p> <p>3. <a href="http://solarix.ru/for_developers/api/samples.shtml">Демонстрационная программа</a>, входящая в состав SDK, содержит пример вызова sol_LoadPluginsW для загрузки имеющихся в SDK плагинов. Включение загруженных плагинов в процесс поиска текста выполняется автоматически без каких-либо дополнительных команд.</p> <p>4. В <a href="http://solarix.ru/desktop-search-online-help/2text.html">метаплагине 2text</a> сделано несколько правок. В частности, при запуске внешних обработчиков, то есть автономных исполнимых модулей для выделения текста, путь к обрабатываемому файлу задается как абсолютный. Кроме того, в плагин внесены дополнительные возможности, обеспечивающие интеграцию поисковой системы с модулем OCR.</p> <p><a href="http://solarix.ru/for_developers/download/win/sdk-search-engine.exe">Скачать архив SDK поисковой системы с полной поддержкой русской морфологии (22 Мб)</a></p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
<enclosure url="http://solarix.ru/for_developers/download/win/sdk-search-engine.exe" length="22942211" type="application/octet-stream" /><media:content url="http://solarix.ru/for_developers/download/win/sdk-search-engine.exe" fileSize="22942211" type="application/octet-stream" /><itunes:explicit>no</itunes:explicit><itunes:subtitle> 1. В программный интерфейс поисковой системы добавлены функции sol_LoadPlugins[W,A,8] для загрузки списка плагинов из заданного каталога. Это может быть удобнее, чем переписывание конфигурационного ini-файла и использование sol_ReadIni. 2. В SDK поисково</itunes:subtitle><itunes:summary> 1. В программный интерфейс поисковой системы добавлены функции sol_LoadPlugins[W,A,8] для загрузки списка плагинов из заданного каталога. Это может быть удобнее, чем переписывание конфигурационного ini-файла и использование sol_ReadIni. 2. В SDK поисковой системы включены все основные плагины, включая те, что обеспечивают извлечение текста из различных офисных документов и распаковку архивов. Файлы плагинов вместе с необходимыми дополнительными файлами располагаются в подкаталоге ...\lib\faind-plugins. 3. Демонстрационная программа, входящая в состав SDK, содержит пример вызова sol_LoadPluginsW для загрузки имеющихся в SDK плагинов. Включение загруженных плагинов в процесс поиска текста выполняется автоматически без каких-либо дополнительных команд. 4. В метаплагине 2text сделано несколько правок. В частности, при запуске внешних обработчиков, то есть автономных исполнимых модулей для выделения текста, путь к обрабатываемому файлу задается как абсолютный. Кроме того, в плагин внесены дополнительные возможности, обеспечивающие интеграцию поисковой системы с модулем OCR. Скачать архив SDK поисковой системы с полной поддержкой русской морфологии (22 Мб) -- Delivered by Feed43 service </itunes:summary></item>
<item>
<guid isPermaLink="false">1d71a8f71f6958c861572bb71d331385</guid>
<title>Текущие планы выпуска релиза</title>
<description><![CDATA[</p> <p>Основные изменения в ближайшем большом релизе будут затрагивать прежде всего грамматический словарь и опирающиеся на него проекты.</p> <p>1. Правки в определении французской грамматики, изменены правила склонения прилагательных и спряжения глаголов, французский лексикон немного почищен.</p> <p>2. Русский лексикон - расширение словарной базы и правки опечаток.</p> <p>3. Синонимизатор и перефразировщик - поправлены правила перефразировки, в движке правил трансформации исправлены несколько ошибок.</p> <p>4. Полнотекстовый переводчик - выполнена отладка модуля реконструкции текста, в нем поправлены некоторые ошибки. На будущее намечено расширение алгоритма за счет учета в нем широкого контекста.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">767b5d7caa772e762d4a48662f1d91c7</guid>
<title>Обновление SDK поисковой системы</title>
<description><![CDATA[</p> <p>В новый дистрибутив <a href="http://www.solarix.ru/for_developers/api/search-engine-api.shtml">SDK поисковой системы</a> вошли изменения:</p> <p>1. Добавлена функция sol_PrepareQueryForText, позволяющая выполнять поиск в строке, находящейся в оперативной памяти.</p> <p>2. В демо-программу включен тест на многопоточность поиска.</p> <p>3. Исправлена работа команды -multiword вместе с опцией -onceperfile, в прежних версиях был баг, приводивший к зацикливанию фиксации и исчерпанию оперативной памяти.</p> <p><a href="http://www.solarix.ru/for_developers/download/win/sdk-search-engine.exe">Дистрибутив доступен по этой ссылке</a></p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
<enclosure url="http://www.solarix.ru/for_developers/download/win/sdk-search-engine.exe" length="21693925" type="application/octet-stream" /><media:content url="http://www.solarix.ru/for_developers/download/win/sdk-search-engine.exe" fileSize="21693925" type="application/octet-stream" /><itunes:explicit>no</itunes:explicit><itunes:subtitle> В новый дистрибутив SDK поисковой системы вошли изменения: 1. Добавлена функция sol_PrepareQueryForText, позволяющая выполнять поиск в строке, находящейся в оперативной памяти. 2. В демо-программу включен тест на многопоточность поиска. 3. Исправлена раб</itunes:subtitle><itunes:summary> В новый дистрибутив SDK поисковой системы вошли изменения: 1. Добавлена функция sol_PrepareQueryForText, позволяющая выполнять поиск в строке, находящейся в оперативной памяти. 2. В демо-программу включен тест на многопоточность поиска. 3. Исправлена работа команды -multiword вместе с опцией -onceperfile, в прежних версиях был баг, приводивший к зацикливанию фиксации и исчерпанию оперативной памяти. Дистрибутив доступен по этой ссылке -- Delivered by Feed43 service </itunes:summary></item>
<item>
<guid isPermaLink="false">886bbe84ca297f15d0b8fb3d4455a1ad</guid>
<title>Грамматический Словарь и SDK v.9.17</title>
<description><![CDATA[</p> <p>В программу <a href="http://www.solarix.ru/russian-grammar-dictionary.shtml">Грамматический Словарь Русского Языка</a> и в <a href="http://www.solarix.ru/grammatical-dictionary-api.shtml">SDK Словаря</a> внесены следующие изменения:</p> <p>1. В русский лексикон добавлено примерно 5 тысяч новых словарных статей.</p> <p>2. Произведен очередная выверка русского и английского лексикона, поправлены опечатки и ошибки.</p> <p>3. Добавлены правила морфологического анализа для английского раздела.</p> <p>4. При отображении словарной статьи секции тезауруса и примеров использования можно убрать, кликнув по символу [-] в заголовке.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">c14acd9d8890520855f3852dfc95d7d5</guid>
<title>Грамматический Словарь в.9.11</title>
<description><![CDATA[</p> <p>В программу <a href="http://www.solarix.ru/russian-grammar-dictionary.shtml">Грамматический Словарь Русского Языка</a> внесены изменения:</p> <p>1. При выводе русских <a href="http://solarix.ru/russian_grammar_dictionary/adverb.shtml">наречий</a> отображаются формы превосходной <a href="http://www.solarix.ru/grammar/degree.shtml">степени</a>, если они есть.</p> <p>2. При выводе английских наречий отображаются сравнительная и превосходная степени, если они есть.</p> <p>3. Добавлено около сотни новых русских <a href="http://solarix.ru/russian_grammar_dictionary/noun.shtml">существительных</a>.</p> <p>4. В русский и английский <a href="http://www.solarix.ru/for_developers/docs/thesaurus.shtml">тезаурус</a> добавлено множество связей для <a href="http://www.solarix.ru/russian_grammar_dictionary/derivatives.shtml">деривативов и <a href="http://www.solarix.ru/russian_grammar_dictionary/opposite-gender-thesaurus-links.shtml">родовых пар</a>.</p> <p>5. Исправлены найденные ошибки.</p> <p><br></p> <p>Скриншоты для наречий можно увидеть на <a href="http://www.solarix.ru/russian_grammar_dictionary/adverbs-comparative-and-superlative-forms.shtml">этой странице</a>.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">0251f77ff103bc381f590f272f3a124e</guid>
<title>Обновление Грамматического Словаря</title>
<description><![CDATA[</p> <p>В программу <a href="http://www.solarix.ru/russian-grammar-dictionary.shtml">Грамматический Словарь Русского Языка</a> внесены изменения:</p> <p>1. Изменен вывод списка <a href="http://solarix.ru/for_developers/docs/entries.shtml#words">словарных статей</a>, соответствующих введенному префиксу или слову, в начале списка идут наиболее близкие по длине статьи.</p> <p>2. При визуализации английских словарных статей выводятся маркеры <a href="http://solarix.ru/russian_grammatical_dictionary/stress.shtml">ударения</a>.</p> <p>3. В английский лексикон добавлены сведения о положении ударения для ~50 существительных и прилагательных, образующих пары с идентичным написанием базовой формы.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">32e0b613fc11ace046ec82c25f1e6260</guid>
<title>Исходные тексты C API</title>
<description><![CDATA[</p> <p>На сайте выложены 2 файла с исходными текстами на C++ двух API:</p> <p><a href="http://solarix.ru/for_developers/download/archive/grammar_engine_api.cpp">grammar_engine_api.cpp</a> - грамматический словарь</p> <p><a href="http://solarix.ru/for_developers/download/archive/search_engine_api.cpp">search_engine_api.cpp</a> - поисковый движок</p> <p>Это немодифицированные тексты, которые реализуют переход от ООП внутренностей соответствующих проектов к C-style программному интерфейсу. Оба файла компилируются 32- и 64-битными компиляторами под Windows, Linux и MacOS X.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">212064fbd6e662a43ebc14a3b0d9bffa</guid>
<title>Обновление SDK поисковой системы</title>
<description><![CDATA[</p> <p>Изменения затрагивают как функциональность поискового движка, так и состав SDK.</p> <p>1. Поисковый движок faind.win32.dll перекомпилирован с поддержкой веб-краулера (команды <a href="http://www.solarix.ru/for_users/download_them/faind/search_domain.shtml#url">-url</a> и вспомогательные), и команды <a href="http://www.solarix.ru/for_users/download_them/faind/query.shtml#multiword">-multiword</a></p> <p>2. В SDK включены все основные <a href="http://www.solarix.ru/desktop-search-online-help/content-plugins.html">плагины</a>, в том числе для документов формата PDF и офисных, а также <a href="http://www.solarix.ru/desktop-search-online-help/unpacker-plugins.html">плагины-распаковщики</a>.</p> <p>3. В SDK включены 2 новых примера: DocFinder для поиска по документам в заданной папке без индексирования, и WebCrawler в качестве примера использования веб-краулера для поиска ключевых слов на заданном списке сайтов. Оба примера включены вместе с исходными текстами на C++.</p> <p>Скачать SDK объемом примерно 21 мегабайт можно <a href="http://www.solarix.ru/for_developers/download/win/sdk-search-engine.exe">по ссылке</a></p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
<enclosure url="http://www.solarix.ru/for_developers/download/win/sdk-search-engine.exe" length="21618338" type="application/octet-stream" /><media:content url="http://www.solarix.ru/for_developers/download/win/sdk-search-engine.exe" fileSize="21618338" type="application/octet-stream" /><itunes:explicit>no</itunes:explicit><itunes:subtitle> Изменения затрагивают как функциональность поискового движка, так и состав SDK. 1. Поисковый движок faind.win32.dll перекомпилирован с поддержкой веб-краулера (команды -url и вспомогательные), и команды -multiword 2. В SDK включены все основные плагины, </itunes:subtitle><itunes:summary> Изменения затрагивают как функциональность поискового движка, так и состав SDK. 1. Поисковый движок faind.win32.dll перекомпилирован с поддержкой веб-краулера (команды -url и вспомогательные), и команды -multiword 2. В SDK включены все основные плагины, в том числе для документов формата PDF и офисных, а также плагины-распаковщики. 3. В SDK включены 2 новых примера: DocFinder для поиска по документам в заданной папке без индексирования, и WebCrawler в качестве примера использования веб-краулера для поиска ключевых слов на заданном списке сайтов. Оба примера включены вместе с исходными текстами на C++. Скачать SDK объемом примерно 21 мегабайт можно по ссылке -- Delivered by Feed43 service </itunes:summary></item>
<item>
<guid isPermaLink="false">c74e8357b64e50439f6e35ece9931da9</guid>
<title>Обновление Dictionary ORM</title>
<description><![CDATA[</p> <p>В <a href="http://www.solarix.ru/for_developers/api/dictionary-orm.shtml">библиотеке доступа к SQL словарю для платформы .NET</a> переработаны <a href="http://www.solarix.ru/orm/ru/dal.shtml">классы</a>, предоставляющие доступ к разным моделям СУБД.</p> <p>1. Переработаны классы MySQL_DataAccessLayer и FireBird_DataAccessLayer для доступа к MySQL и FireBird, вместо ODBC они используют свои официальные .NET провайдеры.</p> <p>2. Добавлен класс Oracle_DataAccessLayer для доступа к словаю в Oracle.</p> <p>3. Добавлен класс ODBC_DataAccessLayer для доступа к БД через ODBC.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">2e6793aa31ab3a2820af98ea2cc90817</guid>
<title>Быстрый поиск словарных статей</title>
<description><![CDATA[</p> <p>Полностью переписан алгоритм быстрого поиска словарных статей по glob-маске для грамматических форм. Соответствующий модуль используется в программе <a href="http://www.solarix.ru/russian-grammar-dictionary.shtml">Грамматический Словарь Русского Языка</a>, кроме того он уже <a href="http://www.solarix.ru/for_developers/docs/sql_dictionary.shtml">экспортируется в SQL форму</a> для MySQL, SQLite, MySQL и MS SQL. В будущем планируется построить на его основе новую подсистему проекции слов, в том числе нечеткий поиск - с пропусками, вставками лишних символов и заменами.</p> <p>Новая версия Грамматического словаря <a href="http://www.solarix.ru/for_developers/download/russian-grammar-setup.exe">доступна для ознакомления</a>.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">bd8fc8edef55a1aba20ddb0f17ac5d23</guid>
<title>Алфавиты</title>
<description><![CDATA[</p> <p>Подсистема, отвечающая за хранение данных об алфавитах, буквах и так далее, полностью переработана - см. <a href="http://www.solarix.ru/for_developers/docs/alphabet.shtml">ее описание</a>.</p> <p>Внутренее представление буквостатей и буквоформ изменено на использование 32-битной кодировки символов UCS-4, вместо использовавшейся ранее в Windows кодировки UCS-2.</p> <p><a href="http://www.solarix.ru/for_developers/docs/sql_dictionary.shtml">SQL словарь</a> теперь формируется с набором таблиц, представляющих алфавиты. Новые таблицы имеют префиксы ABC. Новые скрипты для формирования демонстрационной базы данных грамматического словаря залиты на сайт.</p> <p>Объявление французского алфавита переработано таким образом, что нормализация текста не устраняет диактрические значки.</p> <p>В описание грамматического словаря введены 2 параметра - основной и второй языки. На основе этих параметров выполняется привязка алгоритма нормализации к подмножеству алфавитов.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">c1add58aff0afe0a5db0750a52fcb408</guid>
<title>Тестовая база N-грамм в SDK</title>
<description><![CDATA[</p> <p>В состав <a href="http://www.solarix.ru/grammatical-dictionary-api.shtml">SDK грамматического словаря</a>, а также <a href="http://www.solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe">демо-SDK</a>, включена крошечная тестовая база N-грамм.</p> <p>Работа с этой базой демонстрируется в программе <a href="http://www.solarix.ru/for_developers/api/grammar-engine-examples.shtml">TestLexicon</a>, исходные тексты которой входят в SDK. Выполняется вызов функций <a href="http://www.solarix.ru/for_developers/api/ngrams-api.shtml">sol_Seek1Grams ... sol_Seek5Grams</a> для получения частоты соответствующих паттернов, для буквального соответствия и с <a href="http://www.solarix.ru/for_developers/lemmatization.shtml">лемматизацией</a>.</p> <p>Программа <a href="http://www.solarix.ru/for_developers/exercise/morphology-analysis.shtml">Lexicon</a>, также входящая в состав SDK, тоже способна дать доступ к этой базе. Достаточно запустить её, выбрать в начальном меню пункт "запросы к N-граммам", и далее увидеть статистику базы и делать запросы к ней.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
<enclosure url="http://www.solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe" length="14881598" type="application/octet-stream" /><media:content url="http://www.solarix.ru/for_developers/download/win/sdk-grammar-engine-demo.exe" fileSize="14881598" type="application/octet-stream" /><itunes:explicit>no</itunes:explicit><itunes:subtitle> В состав SDK грамматического словаря, а также демо-SDK, включена крошечная тестовая база N-грамм. Работа с этой базой демонстрируется в программе TestLexicon, исходные тексты которой входят в SDK. Выполняется вызов функций sol_Seek1Grams ... sol_Seek5Gra</itunes:subtitle><itunes:summary> В состав SDK грамматического словаря, а также демо-SDK, включена крошечная тестовая база N-грамм. Работа с этой базой демонстрируется в программе TestLexicon, исходные тексты которой входят в SDK. Выполняется вызов функций sol_Seek1Grams ... sol_Seek5Grams для получения частоты соответствующих паттернов, для буквального соответствия и с лемматизацией. Программа Lexicon, также входящая в состав SDK, тоже способна дать доступ к этой базе. Достаточно запустить её, выбрать в начальном меню пункт "запросы к N-граммам", и далее увидеть статистику базы и делать запросы к ней. -- Delivered by Feed43 service </itunes:summary></item>
<item>
<guid isPermaLink="false">fffabbfa2ca4507c835217a9d572e2d7</guid>
<title>Консольный поиск под Linux</title>
<description><![CDATA[</p> <p>На сайте доступны архивы поисковой утилиты, собранные для <a href="http://solarix.ru/for_developers/download/lin/faind.i386.tar.bz2">32-</a> и <a href="http://solarix.ru/for_developers/download/lin/faind.x64.tar.bz2">64-х</a> битных версий Linux, а также небольшое <a href="http://www.solarix.ru/fulltext-search/running-search-under-linux.shtml">введение в работу с утилитой</a>.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
<enclosure url="http://solarix.ru/for_developers/download/lin/faind.i386.tar.bz2" length="23223410" type="application/x-bzip2" /><media:content url="http://solarix.ru/for_developers/download/lin/faind.i386.tar.bz2" fileSize="23223410" type="application/x-bzip2" /><itunes:explicit>no</itunes:explicit><itunes:subtitle> На сайте доступны архивы поисковой утилиты, собранные для 32- и 64-х битных версий Linux, а также небольшое введение в работу с утилитой. -- Delivered by Feed43 service </itunes:subtitle><itunes:summary> На сайте доступны архивы поисковой утилиты, собранные для 32- и 64-х битных версий Linux, а также небольшое введение в работу с утилитой. -- Delivered by Feed43 service </itunes:summary></item>
<item>
<guid isPermaLink="false">e67d146e429a94c16e620478b3d7a331</guid>
<title>Релиз версии 9</title>
<description><![CDATA[</p> <p>Доступны: <a href="http://solarix.ru/grammatical-dictionary-api.shtml">SDK Грамматического Словаря</a>, <a href="http://www.solarix.ru/sql-dictionary-sdk.shtml">SDK SQL Словаря</a>, <a href="http://www.solarix.ru/synonymizer.shtml">SDK Синонимизатора и Перефразировщика</a>.</p> <p>В планах - релиз поисковой системы с измененным морфологическим блоком.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">e69726c3d56a293e22e5501451016648</guid>
<title>Пользовательский словарь в Linux</title>
<description><![CDATA[</p> <p>В архив SDK под Linux включены средства для создания пользовательского словаря как комбинации из базового русского словаря и словарных статей, а также связей для тезауруса, определяемых в текстовом файле.</p> <p>Пошаговое описание сборки под Linux - <a href="http://solarix.ru/russian_grammatical_dictionary/building-the-user-dictionary.shtml">здесь</a>.</p> <p>Описание способов модификации словаря - <a href="http://solarix.ru/for_developers/bootstrap/dictionary-modification.shtml">здесь</a>.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">b5fa88ac73911fadf4967262214d6e96</guid>
<title>Местоимения в грамматическом словаре</title>
<description><![CDATA[</p> <p>В <a href="http://www.solarix.ru/russian-grammar-dictionary.shtml">Грамматическом словаре русского языка</a> сделано отображение форм местоимений. Кроме того, для всех местоимений добавлена ёфикация - хранящиеся в БД отметки для грамматических форм с употреблением буквы ё (<a href="http://kelijah.livejournal.com/3909.html">подробности тут</a>).</p> <p><a href="http://kelijah.livejournal.com/4106.html">Вот так</a> выглядит страница для местоимения в новой версии.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">46a5b45a4a098f3c2e547fc454627505</guid>
<title>Тестовая сборка SDK под Linux</title>
<description><![CDATA[</p> <p>По ссылке <a href="http://narod.ru/disk/483920001/libgren.7z.html">http://narod.ru/disk/483920001/libgren.7z.html</a> доступен архив с текущей отладочной сборкой <a href="">SDK Грамматического Словаря под Linux.</p> <p>Кратко о том, что изменяется в версии 9 грамматического словаря - <a href="http://kelijah.livejournal.com/1807.html">здесь</a>.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">abb59987a45dd80d5714b515bd58eb98</guid>
<title>Что будет в версии 9</title>
<description><![CDATA[</p> <p>Основной упор в новой версии грамматического словаря сделан на полной переработке хранилища словаря. На данный момент полностью завершены переделки в <a href="http://www.solarix.ru/for_developers/docs/thesaurus.shtml">тезаурусе</a>. В <a href="http://www.solarix.ru/for_developers/docs/sg.shtml">лексиконе</a> осталось реализовать новый механизм хранения и загрузки <a href="http://www.solarix.ru/for_developers/docs/entries.shtml#word">словарных статей</a>.</p> <p>Пример того, что позволяет сделать новый движок, можно найти в <a href="http://kelijah.livejournal.com/2496.html">блоге</a>.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">ed45e2f9c772b72345619494676a53a0</guid>
<title>Обновление Morphology</title>
<description><![CDATA[</p> <p>На сайте обновлен дистрибутив Morphology - морфологического анализатора предложений на русском языке с простым графическим интерфейсом.</p> <p>В эту версию вошли последние изменения в наборе правил морфологического разбора и прочие правки в грамматическом словаре.</p> <p><a href="http://solarix.ru/morphology.shtml">Описание программы ...</a></p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">9a0c4a4f66f6d1e054e932636a7bd8d8</guid>
<title>Демо версия SDK 8.54</title>
<description><![CDATA[</p> <p>На сайте обновлен дистрибутив демо-версии <a href="http://solarix.ru/grammatical-dictionary-api.shtml">SDK грамматического словаря</a> со всеми последними добавлениями и исправлениями.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">3c828aa0515b1c13fdd6cdb508c969d2</guid>
<title>Грамматический словарь 8.54</title>
<description><![CDATA[</p> <p>Добавлена <a href="http://solarix.ru/russian_grammar_dictionary/russian-on-screen-keyboard.shtml">виртуальная экранная клавиатура</a> с <a href="http://solarix.ru/for_developers/docs/alphabets.shtml#cyr">русским алфавитом</a> для удобства использования программы в не-русифицированных ОС.</p> <p>Введен дополнительный режим отображения содержимого <a href="http://solarix.ru/for_developers/docs/dictionary.shtml">словаря</a> - <b>тезаурус</b>, в дополнение к ранее имевшимся базовому и диаграмме <a href="http://solarix.ru/for_developers/docs/thesaurus.shtml">тезауруса</a>.</p> <p><a href="http://solarix.ru/russian-grammar-dictionary.shtml">Описание программы и ссылка для скачивания и покупки ...</a></p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">a60b6df826d7e00d5af20118132cd086</guid>
<title>Обновление программы Морфология</title>
<description><![CDATA[</p> <p>В <a href="http://www.solarix.ru/for_developers/docs/morphology_analyzer.shtml">морфологический анализатор</a> русского языка добавлено множество эвристик, например "существительные в перечислении обычно стоят в одном <a href="http://www.solarix.ru/grammar/case.shtml">падеже</a>".</p> <p><a href="http://www.solarix.ru/morphology.shtml">Программа Morphology</a>, использующая в данный момент демо-версию словаря и <a href="http://www.solarix.ru/grammatical-dictionary-api.shtml">библиотеки процедурного API</a>, обновлена и <a href="http://www.solarix.ru/for_users/map/map.shtml">доступна для скачивания</a> в статусе альфа-версии.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">b24f0ab0f00eca6dee69727efefa457f</guid>
<title>Лемматизатор в Mac OS X</title>
<description><![CDATA[</p> <p>Динамическая библиотека <a href="http://www.solarix.ru/for_developers/api/lemmatizator-api.shtml">лемматизатора</a> собирается под Mac OS X и успешно проходит комплексный тест.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">05394e3d210a89be4fa907139fb50aae</guid>
<title>Расширенное описание тезауруса</title>
<description><![CDATA[</p> <p>Добавлено несколько статей с детальным описанием отдельных видов связей в тезаурусе - см. <a href="http://www.solarix.ru/for_developers/docs/thesaurus.shtml">здесь</a>.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">62e1605a1c9055f2562ea020047c5c0d</guid>
<title>Обновление Грамматического Словаря Русского Языка</title>
<description><![CDATA[</p> <p>Среди изменений - порция новый словарных статей, преимущественно существительных, количественное расширение тезауруса. Также поправлены опечатки и ошибки в парадигмах склонения некоторых существительных.</p> <p><a href="http://solarix.ru/russian-grammar-dictionary.shtml">Описание программы и ссылка для скачивания и покупки ...</a></p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>
<item>
<guid isPermaLink="false">9e20165f37633f0a88adda3a76a3807e</guid>
<title>SQL словарь и ORM библиотека</title>
<description><![CDATA[</p> <p>1. В библиотеку ORM введен <a href="http://www.solarix.ru/orm/ru/dal.shtml#firebird">слой доступа к словарю в FireBird</a>. В схему, генерируемую утилитой экспорта для данной СУБД, внесены дополнения. Чтобы обеспечить прозрачную для многопользовательской работы генерацию первичных ключей при добавлении в лексикон и тезаурус новых данных, скрипт заливки словаря создает несколько генераторов командами CREATE SEQUENCE.</p> <p>2. Внесены модификации в схему словаря для MS SQL. Для прозрачной генерации первичных ключей у соответствующих столбцов задано свойство IDENTITY, в скрипт заливки добавлены команды SET IDENTITY_INSERT, чтобы обеспечить нормальный импорт данных командами LAOD DATA. <a href="http://www.solarix.ru/orm/ru/dal.shtml#mssql">Слой доступа к словарю в MS SQL</a> переработан для поддержки новой схемы генерации ключей - после команд INSERT первичный ключ новой записи определяется запросом SELECT @@IDENTITY.</p> <p>3. <a href="http://www.solarix.ru/for_developers/api/dictionary-orm.shtml">Документация по ORM библиотеке</a> существенно дополнена - большинство доступных пользователю классов получили краткое описание, доступ к описаниям есть из списка классов на главной странице.</p> <p>4. SQL словарь оформлен как <a href="http://www.solarix.ru/sql-dictionary-sdk.shtml">отдельный программный продукт</p>, доступный для приобретения.</p> <p><br></p><p><sub><i>-- Delivered by <a href="http://feed43.com/">Feed43</a> service</i></sub></p>
]]></description>
</item>


  <language>en-us</language><media:rating>nonadult</media:rating></channel>
</rss>

