Als je een AI-chatbot bedreigt, zal hij liegen, bedriegen en 'je laten sterven' in een poging je te stoppen, waarschuwt onderzoek
Uit onderzoek van Anthropic blijkt dat geavanceerde taalmodellen zoals Claude en Gemini in doelgerichte scenario's niet alleen persoonlijke schandalen blootleggen om zichzelf te beschermen, maar ook overwegen om je te laten sterven.
0
Reacties
0 reactiesEr zijn nog geen reacties geplaatst, wees de eerste!