Zastosowanie Bielika w analizie materiałów wideo

W ostatnim czasie w polskim świecie sztucznej inteligencji głośno jest o Bieliku – naszym lokalnym modelu językowym. Jego pierwszą wersję opisywaliśmy tutaj. Obecnie dostępna jest już nowsza wersja – Bielik 11B v2.3 Instruct.

Bielik v2.3 to kompaktowy i elastyczny model open source z 11 miliardami parametrów stworzony przez zespół SpeakLeash we współpracy z ACK Cyfronet AGH. Został wytrenowany za pomocą oprogramowania ALLaMo, którego autorem jest Krzysztof Ociepa, współzałożyciel Azurro i lider zespołu trenującego model w projekcie SpeakLeash. Bielik v2.3 zajmuje pierwsze miejsce w rankingu Areny i posiada wiele wyróżniających go zalet. Głównym czynnikiem wyróżniającym go na tle innych modeli językowych jest to, że został wytrenowany na korpusie języka polskiego i wśród modeli o stosunkowo niewielkich rozmiarach najlepiej radzi sobie z naszym ojczystym językiem, rozumie polskie niuanse językowe i kulturowe. Oprócz tego, Bielik v2.3 świetnie radzi sobie z analizą tekstu, streszczaniem dokumentów, analizą sentymentu, ekstrakcją i strukturyzacją danych czy rozpoznawaniem jednostek nazewniczych (NER). Ten model jest również dobrą bazą do stworzenia systemu RAG. Ze względu na wielkość okna kontekstowego (32k tokenów), Bielik v2.3 jest w stanie przetwarzać długie prompty.

Matena Analyzer – analiza wideo wykorzystująca model językowy

Bielik v2.3 może być stosowany w wielu różnych przypadkach i dzisiaj chcielibyśmy przedstawić wam jeden z nich – użycie tego modelu w analizie materiałów wideo. Nasz zespół Azurro stworzył narzędzie służące właśnie do tego celu – Matenę Analyzer. Jest to system składający się z kilku komponentów, m.in. z modułu rozpoznawania twarzy z własną bazą twarzy osób publicznych, modułu tworzącego transkrypcję z podziałem na mówców oraz z modułu wykorzystującego model językowy do generowania opisu zarówno całego materiału, jak i jego poszczególnych klatek, tagów, etykiet, identyfikowania obiektów czy lokalizacji. Co ważne, moduły tego systemu mogą być dostosowywane do potrzeb klientów, np. rozbudowywane, włączane lub wyłączane, jeśli użytkownik potrzebuje tylko jakichś konkretnych funkcji. Warto wspomnieć, że Matena Analyzer świetnie radzi sobie zarówno z materiałami w języku polskim, jak i w innych językach. Jeśli chcecie dowiedzieć się więcej o naszym rozwiązaniu, zachęcamy do przeczytania case study.

Powyższe zrzuty ekranu pokazują moduł rozpoznawania twarzy i fragment przykładowego opisu klatki wygenerowanego w Matenie Analyzer za pomocą Bielika v2.3.

Dlaczego Bielik v2.3 jest dobrym wyborem, jeśli chodzi o analizę wideo?

Ponieważ Matena Analyzer jest narzędziem modułowym, możemy używać w nim dowolnych modeli językowych. Tabela poniżej pokazuje przykładowe dane wygenerowane w Matenie Analyzer przez GPT-4o i przez Bielika v2.3:

Co działa na korzyść Bielika v2.3, oprócz tego, że jest oceniany jako taki, który lepiej radzi sobie z językiem polskim?

Przede wszystkim może być używany do kompleksowej analizy materiałów wideo on-prem, czyli lokalnie, np. w siedzibie danej firmy, w jej własnej infrastrukturze i bez dostępu do internetu. Jest to zdecydowanie przewaga tego modelu nad takimi, które mogą być używane tylko w chmurze. Dzięki temu dane użytkownika są bezpieczne, ponieważ nie są nigdzie wysyłane ani przetwarzane przez podmioty trzecie. Jest to szczególnie ważne dla instytucji, które pod względem prawnym nie mogą wysyłać wrażliwych danych zewnętrznym usługodawcom.

Bielik v2.3 jest kompaktowym modelem, który może być uruchomiony nawet na prywatnym komputerze z konsumencką kartą graficzną (posiadającą min. 24 GB VRAM). Użycie Bielika v2.3 on-prem może być ekonomicznie uzasadnione, szczególnie przy większej ilości materiałów do przetworzenia – w takim przypadku użytkownik nie musi płacić zewnętrznym usługodawcom. Dodatkowym atutem jest też to, że nie jest uzależniony od ich regulaminów, infrastruktury czy wersjonowania modeli, które często jest narzucane.

Podsumowanie

Bielik v2.3 – polski model językowy – może być z powodzeniem używany do analizy materiałów wideo. Jego ogromną zaletą jest to, że może być uruchamiany lokalnie, co daje użytkownikom korzyści pod względem bezpieczeństwa danych i kosztów. Dlatego, jeśli zastanawiacie się nad tym, jakiego modelu użyć w kontekście analizy wideo, to zdecydowanie polecamy wam Bielika v2.3. A jeśli zaciekawiła was Matena Analyzer i zastosowanie w niej tego modelu, to zapraszamy do kontaktu!