Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.


 

POLECANE
Media: Rosja dzieli się z Iranem zdjęciami satelitarnymi i technologią dronową z ostatniej chwili
Media: Rosja dzieli się z Iranem zdjęciami satelitarnymi i technologią dronową

Moskwa rozszerza zakres wymiany informacji wywiadowczych i współpracy wojskowej z Iranem, dostarczając mu zdjęcia satelitarne i udoskonaloną technologię dronową - napisał we wtorek dziennik „Wall Street Journal”. Ma to pomóc Teheranowi w atakowaniu amerykańskich sił na Bliskim Wschodzie.

USA otworzyły archiwa z pełnymi kartotekami członków NSDAP pilne
USA otworzyły archiwa z pełnymi kartotekami członków NSDAP

Jak poinformował portal dw.com, Amerykańskie Archiwum Narodowe udostępnia w sieci pełne kartoteki członków NSDAP. Tymczasem te same materiały w archiwach niemieckich nadal pozostają tajne, oficjalnie ze względu na ochronę danych.

Angela Merkel wywołała wściekłość Niemców apelując do migrantów, aby głosowali przeciwko AfD z ostatniej chwili
Angela Merkel wywołała wściekłość Niemców apelując do migrantów, aby głosowali przeciwko AfD

Jak poinformował brytyjski portal Daily Mail, Angela Merkel wywołała gniew w Niemczech po tym, jak apelowała do migrantów, aby głosowali przeciwko skrajnie prawicowej partii AfD.

„Teraz Holland może nazywać polskich żołnierzy 's...synami'. Oświadczenie Zbigniewa Ziobry po wyroku sądu z ostatniej chwili
„Teraz Holland może nazywać polskich żołnierzy 's...synami'". Oświadczenie Zbigniewa Ziobry po wyroku sądu

Były minister sprawiedliwości Zbigniew Ziobro wydał na platformie X oświadczenie w związku z wyrokiem nakazującym mu przeproszenie reżyser Agnieszki Holland za wypowiedzi porównujące jej film „Zielona Granica” do nazistowskiej propagandy, a także przekazanie 50 tys. zł na Stowarzyszenie „Dzieci Holocaustu”.

Blokada cieśniny Ormuz. USA poradzą sobie bez Europy, ale czy Europa poradzi sobie bez USA? tylko u nas
Blokada cieśniny Ormuz. USA poradzą sobie bez Europy, ale czy Europa poradzi sobie bez USA?

Apel prezydenta Donald Trump o wsparcie dla operacji w rejonie Cieśnina Ormuz spotkał się z chłodną reakcją Europy. W tle rośnie napięcie wokół konfliktu z Iran i pytania o przyszłość współpracy w ramach NATO oraz bezpieczeństwo energetyczne kontynentu.

Sąd: Ziobro musi przeprosić Holland za wypowiedzi o „Zielonej Granicy” z ostatniej chwili
Sąd: Ziobro musi przeprosić Holland za wypowiedzi o „Zielonej Granicy”

Polityk Suwerennej Polski i były minister sprawiedliwości Zbigniew Ziobro musi przeprosić reżyserkę Agnieszkę Holland za wypowiedzi porównujące jej film „Zielona Granica” do nazistowskiej propagandy, a także przekazać 50 tys. zł na Stowarzyszenie „Dzieci Holocaustu” - wynika z wyroku Sądu Okręgowego w Warszawie.

Chaos w przetargach na Rail Baltica z ostatniej chwili
Chaos w przetargach na Rail Baltica

Jak poinformował Rynek Kolejowy, Krajowa Izba Odwoławcza wydała kolejny wyrok w kilkumiliardowym przetargu na budowę trasy Rail Baltica Białystok – Ełk. KIO nakazała unieważnić wybór jako najkorzystniejszej oferty firmy Budimex. Wcześniej w tym samym przetargu KIO nakazała odrzucić ofertę Mirbudu.

Plan reformy WPR? „Demontaż podstaw stabilności europejskiego rolnictwa” z ostatniej chwili
Plan reformy WPR? „Demontaż podstaw stabilności europejskiego rolnictwa”

Europejska Rada Doradcza ds. zmiany Klimatu przy Komisji Europejskiej w swoim najnowszym raporcie proponuje reformę WPR. Ekspert Jacek Zarzecki, Wiceprzewodniczący Zarządu Polskiej Platformy Zrównoważonej Wołowiny wyjaśnił na Facebooku, na czym będzie owa „reforma” polegała.

Gen. Wroński: Unijny SAFE to parszywy i fałszywy projekt tylko u nas
Gen. Wroński: Unijny SAFE to parszywy i fałszywy projekt

„Unijny SAFE to parszywy projekt, który jest projektem fałszywym z założenia” - ocenia w rozmowie z Tysol.pl gen. Dariusz Wroński, były dowódca 1 Brygady Lotnictwa Wojsk Lądowych, absolwent studiów podyplomowych na Wydziale Ekonomii u pani prof. Doroty Simpson (Uniwersytet Gdański).

Interwencja SKW i policji wobec Rachonia i ekipy TV Republika. Chodzi o nagrania z ostatniej chwili
Interwencja SKW i policji wobec Rachonia i ekipy TV Republika. Chodzi o nagrania

Funkcjonariusze SKW oraz policjanci chcieli uzyskać dostęp do nagrań wykonanych przez dziennikarzy TV Republika. Ci odmówili, powołując się na tajemnicę dziennikarską – informuje we wtorek TV Republika.

REKLAMA

Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.



 

Polecane