Na podstawie naszych doświadczeń związanych z budowaniem asystentów AI przedstawiamy założenia i zasady, jakimi się kierujemy, by nasze boty AI były nie tylko skuteczne i pomocne, ale też bezpieczne: działały zgodnie z procesami organizacji i były odporne na nadużycia.
Jak tworzyć boty AI odporne na ataki
Cyberbezpieczni asystenci AI
Wyobraź sobie, że firmowy asystent AI – zaprojektowany, by wspierać sprzedaż – po krótkiej rozmowie z klientem samodzielnie udziela mu ogromnego rabatu i „sprzedaje” produkt za ułamek ceny. Brzmi jak fikcja? Takie sytuacje już się zdarzyły. Sztuczna inteligencja w biznesie to ogromny potencjał, ale też nowe pole ryzyka. Dlatego bezpieczeństwo asystentów AI musi rosnąć w tym samym tempie, co ich możliwości.
Wyobraź sobie, że firmowy asystent AI – zaprojektowany, by wspierać sprzedaż – po krótkiej rozmowie z klientem samodzielnie udziela mu ogromnego rabatu i „sprzedaje” produkt za ułamek ceny. Brzmi jak fikcja? Takie sytuacje już się zdarzyły. Sztuczna inteligencja w biznesie to ogromny potencjał, ale też nowe pole ryzyka. Dlatego bezpieczeństwo asystentów AI musi rosnąć w tym samym tempie, co ich możliwości.
Odpowiednio przygotowana baza wiedzy
Podstawą każdego asystenta AI jest jego baza wiedzy. Często w firmach jest ona rozproszona w różnych źródłach – dokumentach o różnym formacie, bazach danych lub innych źródłach. Zwykle ich forma powoduje, że AI ma problem z powiązaniem treści zawartych w różnych akapitach czy zrozumieniem relacji w danych tabelarycznych.
W All for One na podstawie doświadczeń zbudowaliśmy odpowiedni formater danych, który pozwala na półautomatyczną konwersję takich dokumentów na formę zrozumiałą dla AI, przez co asystent może odpowiadać w imieniu firmy na pytania, zachowując spójność i pewność informacji.
Bezpieczne modele odpowiednie dla Enterprise
Wprowadzanie do modeli językowych danych wrażliwych czy związanych z tajemnicami przedsiębiorstwa zawsze wiąże się z ryzykiem, takie dane mogą być przechwycone lub upublicznione z powodu wycieku danych, zagrożeń wynikających z błędów czy ataków na dostawcę modelu. Dlatego ważne, aby rozumieć typ danych, na których nasz użytkownik będzie operować w kontakcie z AI, i projektować architekturę dopasowaną do wymaganego poziomu ochrony.
W All for One mamy dostęp do wielu platform i narzędzi, co pozwala nam dobierać rozwiązania dopasowane do indywidualnych potrzeb klienta.
Modułowa architektura wieloagentowa
Nasi asystenci to nie tylko połączenie modelu językowego z interfejsem. To zestaw komponentów mających odpowiednie role, np.:
- moduł LLM do rozumienia języka naturalnego,
- moduł do bazy danych,
- moduł formatujący dane wyjściowe.
Dzięki takiej architekturze możemy łatwo zarządzać wybranymi elementami i zmieniać je tak, aby optymalizować koszty oraz osiągać odpowiedni poziom stabilności i ochrony.
Moduł eliminujący niepożądany kontekst
To jeden z kluczowych elementów każdego naszego asystenta. Moduł ten:
- blokuje możliwość złośliwego zużywania tokenów,
- chroni przed atakami prompt injection,
- zapobiega konwersacjom wykraczającym poza tematykę baz wiedzy.
W praktyce oznacza to, że asystent odpowiada wyłącznie na te pytania, dla których został stworzony.
Ciągły proces kontroli jakości
Uruchomiony produkcyjnie asystent AI jest cyklicznie i automatycznie testowany oraz monitorowany pod kątem:
- stabilności,
- procenta poprawnych odpowiedzi,
- szybkości działania.
Takie podejście zapewnia, że każda anomalia może być natychmiast oflagowana i przekazana do odpowiednich osób, które biorąc pod uwagę jej krytyczność, mogą zdecydować o ewentualnej interwencji.
Indywidualne podejście i kompleksowe działanie
Narzędzia typu ChatGPT wydają się gotowym produktem, który można wdrożyć w firmie i udostępnić pracownikom lub klientom. W rzeczywistości dopiero zrozumienie ryzyk, szans oraz specyfiki organizacji pokazuje, jak wiele dodatkowych komponentów i zabezpieczeń musimy uwzględnić.
Aby chronić firmę przed atakami typu prompt injection, użytkowników przed halucynacjami oraz zapewnić jak najlepszy User Experience, niezbędne jest podejście kompleksowe – takie, jakie stosujemy w naszych projektach.