AI News Summarizer Тратьте меньше времени на чтение новостей

 



ВВЕДЕНИЕ

Что такое SUMMARIZER?

AI News Summarizer - полностью автоматизированная газета.

Summarizer стремится сделать ваши ежедневные новости короче за счет использования ИИ.

Его боты сканируют Интернет в поисках новостей, обобщают их, а затем сортируют по категориям.

Это полностью автоматизированная газета.

Summarizer стремится сделать ваши ежедневные новости короче за счет использования ИИ.

Его боты сканируют Интернет в поисках новостей, обобщают их, а затем сортируют по категориям.

Summarizer доступен только держателям $ SMR.

Вам не придется ничего платить, просто держите

$ SMR для чтения содержимого Summarizer.

В любой момент, когда вы решите прекратить читать Summarizer, вы можете

просто продайте свой SMR в долларах обратно на рынок.

Беги, но боты

Но для человека

Summarizer управляется семейством ботов.

Есть краулер-бот, сумма-бот,

бот-редактор, бот-доставщик, бот-оптимизатор,

ремонтник-бот и др.

AI-Powered

Сделайте ваши ежедневные новости короче

с использованием ИИ

Мы используем TextRank с оптимизацией на

функция подобия для текста

Обобщение.

Элегантно и быстро

Оптимизированный UX и UI

Приходите с темным и светлым режимами, раздетыми

все лишние элементы оптимизированы

для скорости. Статьи о Summarizer

обычно требуется менее 1 секунды, чтобы полностью

загружен.

Телеграмма

Вы любите Telegram, правда?

Хорошие новости! Есть бот

Семейство ботов Summarizer

специализируется на доставке Summarizer

контент в Telegram

Никаких проблем с оплатой

Потому что нет оплаты

Абонентской платы нет, вы просто

удерживайте $ SMR, чтобы прочитать Summarizer. в любом

время, вы решили перестать читать

Summarizer, вы можете продать свой SMR в долларах

обратно на рынок.

Конфиденциальность

В Summarizer нет трекера

В отличие от почти любого другого новостного сайта,

В Summarizer нет ни одной части

код для отслеживания вашей личности и

поведение.

Алгоритм

TextRank - это неконтролируемый алгоритм автоматического резюмирования текстов, который также может быть

используется для получения наиболее важных ключевых слов в документе. Его представила Рада Михалча.

и Пол Тарау

Алгоритм применяет вариацию PageRank на графике, построенном специально для задачи

Обобщение. Это дает ранжирование элементов на графике: самые важные

элементы - это те, которые лучше описывают текст. Такой подход позволяет TextRank создавать

резюме без необходимости в учебном корпусе или маркировке и позволяет использовать алгоритм

с разными языками.

Для задачи автоматического суммирования TextRank моделирует любой документ в виде графа, используя

предложения как узлы. Функция для вычисления сходства предложений необходима для построения ребер в

между. Эта функция используется для взвешивания ребер графа, чем выше сходство между

предложения, тем важнее будет грань между ними в графе. В области

Random Walker, который часто используется в PageRank, мы можем сказать, что мы с большей вероятностью перейдем от

одно предложение к другому, если они очень похожи.

TextRank определяет отношение сходства между двумя предложениями на основе содержимого, которое

оба разделяют. Это перекрытие рассчитывается просто как количество общих лексических лексем между

разделите их на длину каждого, чтобы избежать использования длинных предложений. Функция, представленная в

исходный алгоритм можно формализовать как:

Определение 1. Учитывая Si

, Sj два предложения, представленные набором из n слов, которые в Si представлены

поскольку Si = wi

, wi

, ..., wi

. Функцию подобия для Si, Sj можно определить как:

Результатом этого процесса является плотный граф, представляющий документ. Из этого графика PageRank

используется для вычисления важности каждой вершины. Выбраны наиболее значимые предложения

и представлены в том же порядке, в каком они указаны в документе в качестве резюме.

Эти идеи основаны на изменении способа вычисления расстояний между предложениями.

для взвешивания ребер графа, используемого для PageRank. Эти меры подобия ортогональны

модель TextRank, поэтому их можно легко интегрировать в алгоритм. Мы нашли некоторые из этих

вариации для получения значительных улучшений по сравнению с исходным алгоритмом.

Самая длинная общая подстрока Из двух предложений мы определяем самую длинную общую подстроку и

Сообщите о сходстве как о его длине

Косинусное расстояние Косинусное сходство - это показатель, широко используемый для сравнения текстов, представленных как

векторов. Мы использовали классическую модель TF-IDF для представления документов в виде векторов и вычислили

косинус между векторами как мера сходства. Поскольку векторы определены как положительные,

косинус приводит к значениям в диапазоне [0,1], где значение 1 представляет идентичные векторы, а 0

представляющие ортогональные векторы.

BM25 BM25 / Okapi-BM25 - это функция ранжирования, широко используемая в качестве передовой информации

Поисковые задания. BM25 - это вариант модели TF-IDF, использующий вероятностную модель.

Определение 2. Для двух предложений R, S, BM25 определяется как:

где k и b - параметры. Мы использовали k = 1,2 и b = 0,75. avgDL - средняя длина

предложения в нашей коллекции.

Эта функция окончательная




улучшение на 2,92% по сравнению с исходным результатом TextRank с использованием BM25 и = 0,25. В

На следующей диаграмме показаны результаты, полученные для различных предложенных нами вариантов.

Результат косинусного подобия также был удовлетворительным с улучшением на 2,54% по сравнению с исходным.

методы. Вариант LCS также работал лучше, чем исходный алгоритм TextRank с 1,40%.

общие улучшения.

Производительность во времени также была улучшена. Мы смогли обработать 567 документов из

База данных DUC2002 в 84% времени, необходимого в исходной версии.




Я разместил ссылку для получения дополнительной информации ниже









АВТОР: Дандиха88

Ссылка на профиль форума: https://bitcointalk.org/index.php?action=profile;u=3242971

Адрес кошелька: 0xA51Ab0569EdE2994060BAbf047B5776F5e93CFE1


Komentar

Postingan populer dari blog ini

The WorkQuest Blockchain

Meteorite Finance Platform for decentralized

The Next Crypto Evolution Is Here: RBX