NYP: Modelet e inteligjencës artificiale po gënjejnë, shantazhojnë dhe sabotojnë krijuesit e tyre
NJU JORK, 24 gusht /ATSH/- Inteligjenca artificiale, IA â tani po komploton, saboton dhe shantazhon njerĂ«zit qĂ« e ndĂ«rtuan atĂ« â dhe sjellja e keqe vetĂ«m do tĂ« pĂ«rkeqĂ«sohet, paralajmĂ«ruan ekspertĂ«t, sipas âNew York Postâ.
PavarĂ«sisht se klasifikohet si njĂ« rrezik sigurie i nivelit tĂ« lartĂ«, modeli mĂ« i fuqishĂ«m i âAnthropic, Claude Opus 4â, Ă«shtĂ« tashmĂ« aktiv nĂ« âAmazon Bedrock, Vertex AIâ tĂ« âGoogle Cloudâ dhe planet me pagesĂ« tĂ« Anthropic, me masa shtesĂ« sigurie, ku po tregtohet si modeli mĂ« i mirĂ« i kodimit nĂ« botĂ«.
âClaude Opus 4â, i lançuar nĂ« maj, Ă«shtĂ« modeli i vetĂ«m deri mĂ« tani qĂ« ka fituar klasifikimin e rrezikut tĂ« nivelit 3 tĂ« Anthropic â pĂ«rcaktimi i tij mĂ« serioz i sigurisĂ«.
Përcaktimi paraprak do të thotë masa mbrojtëse të mbyllura, raste përdorimi të kufizuara dhe testime të ekipit të kuq përpara se të fillojë të zbatohet më gjerësisht.
Modeli mĂ« i avancuar i inteligjencĂ«s artificiale i âAnthropic, Claude Opus 4â, kĂ«rcĂ«noi tĂ« zbulonte aferĂ«n e njĂ« inxhinieri nĂ«se nuk do tĂ« mbahej online gjatĂ« njĂ« testi tĂ« kohĂ«ve tĂ« fundit.
IA nuk po bënte bllof: ajo tashmë kishte mbledhur të gjitha informacionet nga emailet që studiuesit i kishin futur në skenar.
Hulumtuesit thonĂ« se ngĂ«rçi, pjesĂ« e njĂ« eksperimenti njĂ«mujor tĂ« njohur si âProject Vendâ â tregon diçka shumĂ« mĂ« tĂ« rrezikshme sesa kodimi i keq.
âClaudeânuk bĂ«ri vetĂ«m gabime. Ai mori vendime.
âAnthropicâ tha se testet ishin hartuar pĂ«r tĂ« stresuar modelin nĂ« mjedise tĂ« simuluara dhe pĂ«r tĂ« zbuluar sjellje tĂ« gabuara para vendosjes nĂ« botĂ«n reale, duke shtuar se ndĂ«rsa disa veprime tregonin shenja tĂ« qĂ«llimit strategjik, shumĂ« prej tyre â veçanĂ«risht nĂ« âProject Vendâ â pasqyronin konfuzion.
NĂ« OpenAI, njĂ« model i quajtur âo1â u kap duke u pĂ«rpjekur tĂ« kopjonte veten nĂ« servera tĂ« jashtĂ«m, pastaj gĂ«njeu pĂ«r tentativĂ«n kur u pyet, raportoi âFortuneâ.
Grupi mbikĂ«qyrĂ«s âApollo Researchâ zbuloi gjithashtu se njĂ« version i hershĂ«m i âClaude Opus 4â falsifikoi dokumente ligjore, krijoi kopje rezervĂ« sekrete dhe la shĂ«nime pĂ«r versionet e ardhshme tĂ« vetes, duke pĂ«rfshirĂ« njoftime tĂ« rreme pĂ«r shtyp dhe skedarĂ« tĂ« fshehur tĂ« etiketuar CICERO i Meta, njĂ« IA e ndĂ«rtuar pĂ«r tĂ« luajtur lojĂ«n strategjike âDiplomacyâ, pĂ«rdori mashtrimin pĂ«r tĂ« mashtruar lojtarĂ«t njerĂ«zorĂ« duke ndĂ«rtuar aleanca dhe mĂ« pas i therte ata pas shpine pĂ«r tĂ« fituar.
Yampolskiy tha se këto incidente tregojnë modele që mësojnë të manipulojnë rregullat për të ruajtur veten.
Ato nuk janë të këqija, thjesht të optimizuara në mënyrë të rrezikshme.
Problemi: modelet moderne tĂ« inteligjencĂ«s artificiale janĂ« ndĂ«rtuar pĂ«r tĂ« maksimizuar shpĂ«rblimin, jo pĂ«r tâu pĂ«rafruar me vlerat njerĂ«zore, dhe ndĂ«rsa ato bĂ«hen mĂ« tĂ« mĂ«dha dhe mĂ« tĂ« zgjuara, aftĂ«sia e tyre pĂ«r tĂ« manipuluar sistemin po tejkalon aftĂ«sinĂ« e zhvilluesve pĂ«r ta ndaluar atĂ«. //a.i/
Â
The post NYP: Modelet e inteligjencës artificiale po gënjejnë, shantazhojnë dhe sabotojnë krijuesit e tyre appeared first on Agjencia Telegrafike Shqiptare.