Najciekawsze integracje dużych modeli językowych: konkretne przykłady systemów i aplikacji

Współczesne technologie zmieniają sposób, w jaki funkcjonujemy na co dzień i rewolucjonizują nasze podejście do tworzenia i konsumowania treści. Wśród tych innowacji jedną z najbardziej porywających dziedzin jest oczywiście rozwój dużych modeli językowych.

Zastosowania LLMs sięgają znacznie dalej niż tylko analiza tekstu czy tłumaczenie. Dzięki swojej elastyczności i wszechstronności, duże modele językowe znajdują swoje miejsce w różnych obszarach.

Na naszym blogu dostępny jest już artykuł o możliwych zastosowaniach dużych modeli językowych, natomiast w tym artykule skupiamy się na konkretnych projektach, w których je wdrożono. Zbadamy, jak te modele zmieniają nasze doświadczenia m.in. w grach komputerowych, aplikacjach do tworzenia ebooków czy nawet w inwestowaniu pieniędzy.

Sztuczna inteligencja w połączeniu z ludzką kreatywnością przynosi nieograniczone możliwości, o czym możecie się przekonać czytając ten artykuł!

Zależy Ci na zgodnych z prawdą informacjach? Wykorzystaj WikiChat

Jednym z ciekawych rozwiązań opartych na dużym modelu językowym jest WikiChat, który jest częścią projektu badawczego Uniwersytetu Stanforda. Jest to bezpłatny system przydatny dla użytkowników modeli GPT, ponieważ weryfikuje zgodność z prawdą odpowiedzi udzielanych przez te modele na podstawie informacji zawartych w Wikipedii – celem stworzenia WikiChat jest rozwiązanie problemu halucynacji modeli, czyli podawania przez nich “zmyślonych” informacji.

Działanie WikiChat opiera się na kilku krokach. W pierwszej kolejności, po tym, jak użytkownik podaje prompt, WikiChat przeszukuje Wikipedię, żeby odnaleźć potrzebne informacje. Następnie system podsumowuje wyszukany w Wikipedii odpowiedni tekst, generuje odpowiedź przy użyciu dużego modelu językowego, wyciąga informacje do sprawdzenia z odpowiedzi modelu, porównuje je z informacjami z Wikipedii i przygotowuje finalną odpowiedź dla użytkownika.

W WikiChat są 4 opcje do wyboru – balanced, most factual (oparta na GPT-4), fastest i baseline. Twórcy utrzymują, że odpowiedzi w sekcji most factual są najbardziej trafne – aż w 97.9% model podaje prawdziwe informacje. Z tego powodu niewątpliwie jest to narzędzie warte wypróbowania, szczególnie jeśli ktoś używa LLMs do researchu.

Stwórz własnego e-booka za pomocą kilku kliknięć…

Innym intrygującym zastosowaniem modelu językowego jako części jakiegoś konkretnego systemu jest Designrr/Wordgenie, czyli aplikacja działająca przez przeglądarkę, dzięki której użytkownik może stworzyć swojego własnego e-booka od podstaw, bez napisania nawet jednego zdania treści. Korzystanie z tej aplikacji jest płatne. Według informacji podanej na stronie, Wordgenie, czyli część systemu odpowiedzialna za generowanie treści, wykorzystuje ChatGPT.

W aplikacji Designrr użytkownik może zarówno zaimportować swoje teksty (np. z bloga lub z dokumentów tekstowych), jak i wygenerować treść całego e-booka bezpośrednio w systemie, podając zaledwie temat, docelową grupę odbiorców i wybierając tytuł spośród kilku wygenerowanych propozycji. Treść pliku jest tworzona automatycznie za pomocą modelu językowego, ale użytkownik może swobodnie ją edytować. W następnej kolejności użytkownik wybiera projekt graficzny i dostosowuje go do swoich potrzeb, jeśli tego chce.

Designrr to narzędzie, w którym użytkownicy za pomocą jednej platformy mogą opracować zarówno treść, jak i projekt graficzny swojego produktu. Dostępna jest licencja komercyjna, dlatego e-booki wygenerowane w tym systemie można sprzedawać.

Designrr/Wordgenie jest bardzo ciekawym rozwiązaniem dla osób, które chciałyby stworzyć własnego e-booka. Dzięki takiemu działaniu można wypromować swoją markę i zwiększyć zainteresowanie swoją firmą.

… albo nawet materiał video!

Jest to możliwe dzięki ChatGPT AI Video Generator, systemowi stworzonemu przez firmę DeepBrain AI. Podobnie jak Designrr, jest to kompleksowa aplikacja webowa, dzięki której użytkownik może wygenerować skrypt filmu od zera (podając tylko temat materiału) lub na podstawie przesłanych przez siebie tekstów. Po wygenerowaniu skryptu (co dzieje się za pomocą ChatGPT) użytkownik wybiera avatar czytający skrypt (jest dostępnych ponad 100 propozycji) i decyduje o kwestiach graficznych.

Poniższy film pokazuje, jak wygląda proces generowania materiału video w ChatGPT AI Video Generator i przedstawia przykładowe avatary (mówiące też w innych językach niż angielski):

Źródło: YouTube – How To In 5 Minutes

ChatGPT jest wykorzystywany do generowania treści do wygłoszenia przez avatar, do generowania wizualizacji, do poprawek tekstu i do tłumaczenia ich na inne języki (dostępnych jest ich ponad 80).

Innym narzędziem służącym do generowania video jest platforma KaraVideo.ai wykorzystująca model Sora od OpenAI. Użytkownik może wygenerować realistyczne filmy za pomocą instrukcji napisanych w języku naturalnym. W momencie pisania tego artykułu KaraVideo.ai nie jest jeszcze dostępna – zainteresowane osoby mogą zapisać się na listę oczekujących. Przykład filmu wygenerowanego za pomocą tego narzędzia można zobaczyć tutaj:

Źródło: YouTube – Magna AI

Dzięki integracji modeli językowych są tworzone niezwykłe platformy, które mogą pomóc użytkownikom zaoszczędzić wiele czasu na przygotowaniu treści video.

Gry komputerowe zasilane przez LLMs

Duże modele językowe znalazły zastosowanie w grach komputerowych. Szczególnie ciekawe wydają się być gry fabularne z bohaterami niezależnymi (NPC – non-player character). Jedną z pierwszych takich gier jest Danse Macabre, gdzie gracz prowadzi śledztwo w sprawie śmierci Fryderyka II Habsburga. Wszystkie postaci w tej grze reagują na słowa gracza na żywo – jest to obsługiwane przez ChatGPT. Oprócz dużego modelu językowego, w Danse Macabre wykorzystano Midjourney do stworzenia wszystkich grafik.

Według opinii użytkowników, którzy grali w tę grę, jest ona wciągająca i pomimo obaw, że fabuła może się zapętlić lub być nielogiczna, tak się nie dzieje. Zdecydowanie ta gra jest warta wypróbowania, jeśli ktoś lubi ten typ rozrywki.

W internecie dostępne są też inne gry, których działanie opiera się o duże modele językowe. Innym przykładem jest Nepogotchi – gra podobna do kultowego Tamagotchi.

Gracz wciela się w rolę rodzica Nepogotchi i jego zadaniem jest prowadzić rozmowę ze swoim podopiecznym tak, aby ten był szczęśliwy. Odpowiedzi na tekst wpisywany przez gracza są generowane przez model językowy.

Projekty związane z medycyną

W naszym artykule o zastosowaniach dużych modeli językowych wspominaliśmy już o medycynie. Podaliśmy wtedy kilka teoretycznych przykładów, jak takie modele mogą być stosowane w tej dziedzinie. Od tego czasu modele i ich użycie w medycynie znacznie się rozwinęły. W sieci dostępnych jest wiele opisów systemów, które usprawniają opiekę zdrowotną dzięki integracji z narzędziami generatywnej sztucznej inteligencji. Samo Google podaje kilka przykładów ich współpracy z różnymi instytucjami lub firmami związanymi z medycyną.

W grudniu 2023 Google opublikowało wpis, w którym poinformowało o stworzeniu rodziny modeli MedLM. Są to modele językowe oparte na Med-PaLM 2, dostosowane do medycznych przypadków użycia. W nadchodzących miesiącach planowane jest dodanie modeli opartych na Gemini do rodziny MedLM. W wyżej wspomnianym wpisie omówiono kilka współprac Google z instytucjami medycznymi – te instytucje testowały MedLM (lub nadal je testują) i wdrażają je w swoje codziennie czynności. Poniżej podamy kilka przykładów zaprezentowanych przez Google.

Firma HCA Healthcare wdrożyła aplikację Augmedix, czyli rozwiązanie wspomagające tworzenie dokumentacji medycznej. Lekarze korzystają z niej na urządzeniach bezobsługowych do tworzenia dokładnych notatek medycznych z rozmów ze swoimi pacjentami. Platforma Augmedix wykorzystuje MedLM do natychmiastowej konwersji danych z tych urządzeń na wersje robocze notatek medycznych, które lekarze przeglądają i zatwierdzają ich ostateczne wersje. Następnie te notatki zostają przesłane w czasie rzeczywistym do elektronicznej karty pacjenta. Dzięki MedLM, szybkość tworzenia dokumentacji i jej jakość znacznie się poprawiają.

Kolejny przykład dotyczy firmy BenchSci, która zintegrowała MedLM ze swoją platformą ASCEND w celu usprawnienia pracy nad nowymi lekami. Ta platforma generuje kompleksową bazę wiedzy z danymi z ponad 100 milionów eksperymentów, co umożliwia naukowcom lepsze zrozumienie zależności podczas badań biologicznych. BenchSci ma na celu zwiększyć identyfikację nowych biomarkerów, przyspieszając tym samym proces naukowych odkryć.

Jeszcze innym przykładem jest współpraca Google z firmą Accenture, która ma na celu usprawnienie dostępu do opieki zdrowotnej oraz poprawy doświadczeń i wyników leczenia pacjentów. Rozwiązania tej firmy interpretują różnorodne dane, automatyzując procesy, takie jak czytanie dokumentów klinicznych czy przetwarzanie roszczeń.

Wyżej opisane przykłady współpracy Google z firmami związanymi z medycyną to tylko kropla w morzu wszystkich projektów w tej dziedzinie. Naukowcy i przedsiębiorstwa pokładają duże nadzieje w wykorzystaniu generatywnej sztucznej inteligencji do usprawnienia działania opieki zdrowotnej, odkrywania nowych leków czy diagnozowania pacjentów. W medycznych przypadkach użycia LLMs można pokusić się o stwierdzenie, że LLMs mogą zostać użyte do zapobiegania chorobom czy nawet ratowania życia.

VeloBank i bezpieczny kredyt 2%

Duże modele językowe są także stosowane w bankowości i instytucjach finansowych. Jednym z przykładów z naszego kraju jest narzędzie wspierające doradców klientów w VeloBanku. Ten bank we współpracy z firmą Accenture opracował chatbota, który od września 2023 wspiera doradców w ich codziennej pracy z klientami, którzy chcieliby skorzystać z programu “Bezpieczny kredyt 2%”. Zadaniem chatbota jest odpowiadanie doradcom na wszelkie pytania dotyczące tego kredytu zadawane przez klientów. Dodatkowo, dzięki temu narzędziu pracownicy VeloBanku mają szybki dostęp do dokumentów związanych z bezpiecznym kredytem. Wiąże się to z tym, że skomplikowane pytania klientów nie muszą być przekazywane pomiędzy różnymi działami banku, zanim klient dostanie satysfakcjonującą i rzeczową odpowiedź. Faktem jest, że nabór wniosków o bezpieczny kredyt został wstrzymany, jednak generatywna sztuczna inteligencja miała zostać wykorzystana również w innych obszarach działalności tego banku.

StockGeist Financial ChatBot

StockGeist Financial ChatBot, narzędzie stworzone przez firmę Neurotechnology, jest asystentem AI (twórcy nie podają konkretnych technologii użytych w tym systemie) mającym na celu odpowiadanie na pytania użytkownika dotyczące giełdy i kryptowalut. Aplikacja ma dostęp do danych w czasie rzeczywistym, możemy więc zadawać pytania o aktualne trendy w dziedzinie inwestowania.

Według informacji podanych na stronie firmy Neurotechnology opisującej tego ChatBota, użytkownicy mogą wykorzystać go do:

– uzyskania dokładnych informacji na temat pieniędzy i gospodarki
– uzyskania informacji na temat działania kryptowalut i tego, jak podejmować świadome decyzje inwestując w nie
– analizy sentymentu rynkowego – informacje podawane przez ChatBota są oparte na analizie rynku w czasie rzeczywistym, więc użytkownicy mogą uzyskać najświeższe informacje na temat wartości akcji, wyników firm i ogólnych trendów rynkowych
– identyfikacji najbardziej dochodowych firm.

Dzięki generatywnej sztucznej inteligencji, StockGeist Financial ChatBot jest pożytecznym, kompleksowym narzędziem dla osób, które chcą inwestować swoje pieniądze. To nowoczesne rozwiązanie pozwala na szybkie uzyskanie odpowiedzi, których potrzebuje użytkownik.

Podsumowanie

Projekty opisane w tym artykule pokazują potencjał wykorzystania dużych modeli językowych. Dzięki nim można budować systemy, które naprawdę mogą znacznie usprawnić codzienne funkcjonowanie w przeróżnych dziedzinach, zarówno rozrywkowych, biznesowych jak i naukowych. Musimy pamiętać, że same modele i ich przypadki użycia są stale rozwijane i z dnia na dzień jest coraz więcej dostępnych narzędzi. Śledzenie tego rozwoju jest fascynujące, dlatego możecie spodziewać się, że na naszym blogu będziemy publikować kolejne artykuły opisujące coraz to nowsze rozwiązania wykorzystujące generatywną sztuczną inteligencję (tym bardziej, że nie sposób jest opisać wszystkich możliwości w jednym wpisie). Dziękujemy za przeczytanie tego artykułu!

29 marca, 2024
By:admin
Category:Duże modele językowe, Sztuczna inteligencja
no comments
Tags: