Time Bandit czyli jak zmusić ChatGPT-4o do złamania zasad, nowa technika jailbreakingu modeli LLM

Na stronie CERT/CC pojawiła się szczegółowa notatka dotycząca nowej metody obejścia zabezpieczeń produktu firmy OpenAI – ChatGPT-4o. Jak większość produkcyjnie dostępnych dużych modeli językowych (LLM), tak i ChatGPT posiada zabezpieczenia, które mają na celu uniemożliwić lub ograniczyć odpowiedzi na niektóre tematy. Metoda “przekonania” modelu do odpowiedzi na zakazane pytania nosi... Artykuł Time Bandit czyli jak zmusić ChatGPT-4o do złamania zasad, nowa technika jailbreakingu modeli LLM pochodzi z serwisu Sekurak.

Lut 6, 2025 - 08:45

0

Time Bandit czyli jak zmusić ChatGPT-4o do złamania zasad, nowa technika jailbreakingu modeli LLM

Na stronie CERT/CC pojawiła się szczegółowa notatka dotycząca nowej metody obejścia zabezpieczeń produktu firmy OpenAI – ChatGPT-4o. Jak większość produkcyjnie dostępnych dużych modeli językowych (LLM), tak i ChatGPT posiada zabezpieczenia, które mają na celu uniemożliwić lub ograniczyć odpowiedzi na niektóre tematy. Metoda “przekonania” modelu do odpowiedzi na zakazane pytania nosi...

Artykuł Time Bandit czyli jak zmusić ChatGPT-4o do złamania zasad, nowa technika jailbreakingu modeli LLM pochodzi z serwisu Sekurak.

Tagi:

Poprzedni Artykuł

Zakupy z Temu lub Shein mogą być droższe. To efekt zamieszania z opłatami celnymi

Następny Artykuł

Wszyscy ją mają. Firefox już też

Powiązane Posty

Stany Zjednoczone nakładają sankcje na transport irańskiej ropy naftowej do Chin

Stany Zjednoczone nakładają sankcje na transport irańsk...

Lut 6, 2025 0

Google Messages znów z opcją ustawienia własnego awatara kontaktów

Google Messages znów z opcją ustawienia własnego awatar...

Lut 2, 2025 0

Krytyka Marvel's Spider-Man 2 na PC była tak wielka, że tydzień po premierze gra Sony otrzymała pierwszą dużą aktualizację. Deweloperzy już obiecują kolejne poprawki

Krytyka Marvel's Spider-Man 2 na PC była tak wielka, że...

Lut 6, 2025 0