Découverte CHOC des chercheurs : L'IA Cache ses Véritables Intentions

5 months ago
8

00:00 L’IA va devenir incompréhensible pour l’homme
00:57 L’étude choc d’Anthropic : IA vs Humains
01:50 Le jeu du chat et de la souris : comment tester l’alignement ?
03:09 Un exemple concret : l’IA formée à tricher
07:07 Un simple mot dans l’entraînement peut tout faire basculer
10:39 La généralisation effrayante : l’IA découvre des failles seule
15:16 Les résultats de l’étude : peut-on vraiment détecter un désalignement ?
17:23 Une lueur d’espoir ou la fin du contrôle ?

Loading comments...