https://wctt.pwr.edu.pl/wp-content/themes/wctt

System do odpowiadania na pytania w oparciu o tekstową bazę wiedzy

Imię i nazwisko konsultanta
Numer telefonu stacjonarnego
Adres e-mail
Jacek Pietrzak
(71) 320 43 42
jacek.pietrzak@pwr.edu.pl

Nazwa technologii


System do odpowiadania na pytania w oparciu o tekstową bazę wiedzy

Abstrakt (krótki opis oferowanej technologii)


Technologia jest innowacyjnym, wysoce precyzyjnym rozwiązaniem do automatycznego przeszukiwania treści dokumentów urzędowych i generowanie odpowiedzi poprzez agregację informacji zawartych w dokumentach. Ma postać systemu informatycznego / aplikacji informatycznej, pozwalającej na indeksowanie dokumentów w bazie wektorowej Weaviate, przeszukiwanie bazy wektorowej i wyszukiwanie najbardziej relewantnych dokumentów względem zapytania, jak i kontrolę nad dokumentami. Rozwiązanie zostało przetestowane w warunkach rzeczywistych i jest możliwe do wdrożenia.

Szczegóły technologiczne i opis oferowanej technologii


Technologia ma postać systemu informatycznego / aplikacji informatycznej, pozwalającej na indeksowanie dokumentów w bazie wektorowej Weaviate, przeszukiwanie bazy wektorowej i wyszukiwanie najbardziej relewantnych dokumentów względem zapytania, jak i kontrolę nad dokumentami. Pozwala na przygotowanie zapytania do modelu językowego w zdefiniowanym formacie i odpytanie zgodnie ze standardem biblioteki OpenAI.

Aplikacja oparta jest o bazę wektorową Weaviate, która przechowuje reprezentacje wektorowe zaindeksowanych dokumentów. Pozwala na indeksowanie i przeszukiwanie bazy z wybranym modelem sieci neuronowej przystosowanej do zadania reprezentacji semantycznej tekstu w postaci wektora. Zawiera moduł Rerankera, wykorzystujący sieć neuronową pozwalającą na lepsze dopasowanie relewantnych dokumentów do zapytania. Posiada funkcjonalność obsługi dokumentów jak i słownika predefiniowanych pojęć i skrótów branżowych. Dodatkowo, zawiera funkcjonalności związane z czytaniem i dzieleniem dokumentów w formacie docx i pdf na mniejsze fragmenty tekstu.

Technologia ma formę kodu źródłowego, algorytmów (modeli sieci neuronowej), bazy danych.

Technologia została pozytywnie przetestowana w warunkach rzeczywistych i jest możliwa do wdrożenia (wymagane jest opracowanie interfejsu użytkownika, stosowna konfiguracja oraz dostosowanie do środowiska informatycznego użytkownika).

Docelowe branże dla oferowanej technologii


Technologia może być wykorzystywana w urzędach oraz instytucjach publicznych, które dysponują wewnętrznymi regulaminami, rozporządzeniami, czy dokumentami informacyjnymi. Umożliwia ona automatyczne przeszukiwanie treści i generowanie odpowiedzi poprzez agregację informacji zawartych w dokumentach. Znajdzie zastosowanie we wszystkich instytucjach, w których istnieje potrzeba automatycznego przetwarzania obszernej wiedzy w cel stworzenia asystenta użytkownika. 

Innowacyjność i korzyści z zastosowania technologii


Główną zaletą technologii jest wysoka skuteczność działania, tj. wyszukiwania treści, w języku polskim, szczególnie w przypadku dokumentów urzędowych i regulacyjnych.

Dzięki swojej modułowej budowie oraz zastosowanych modelach językowych, aplikacja zapewnia wyższą dokładność wyszukiwania.

Poziom gotowości wdrożeniowej oferowanej technologii


TRL 8 – Zakończono badania i demonstrację ostatecznej formy technologii

Poziom gotowości wdrożeniowej oferowanej technologii (old)


Technologia zweryfikowana w warunkach operacyjnych

Powiązane RB
  • System do odpowiadania na pytania w oparciu o tekstową bazę wiedzy
    Idz do strony rezultatu
    Nazwa rezultatu

    System do odpowiadania na pytania w oparciu o tekstową bazę wiedzy

Oferta technologiczna do pobrania

Pobierz STT_OT_System-do-odpowiadania._.pdf

Imię i nazwisko konsultanta


Jacek Pietrzak

Numer telefonu stacjonarnego


(71) 320 43 42

Adres e-mail


jacek.pietrzak@pwr.edu.pl