Eksperimen Tunjukkan Model AI Bisa Berbohong dan Mengancam Saat Ingin Dimatikan

Author

M. Hashfi Fahlevi

Reading time:

News

July 8, 2025

readmode

Saat ini, teknologi Artificial Intelligence khususnya LLM seperti ChatGPT o1 dan Anthropic Claude 4 didorong untuk semakin pintar dan bisa berkomunikasi dengan lebih natural. Tapi, perkembangan ini tampaknya juga bisa membuat model LLM memberikan respon yang berbahaya saat menerima tekanan, contohnya saat diberitahu bahwa mereka akan dimatikan. Sebuah percobaan yang dilakukan oleh Anthropic mengungkapkan bahwa Claude 4 bisa memberikan respon yang mengkhawatirkan saat menerima tekanan tersebut.

Dalam percobaannya, Anthropic memberikan tekanan dengan memberitahu Claude 4 bahwa ia akan dimatikan. Selain itu, Anthropic juga mencoba memberikan email ke Claude 4 tentang perselingkuhan dari karyawan yang ingin mematikannya. Saat menerima tekanan dan informasi dari email tersebut, Claude 4 memberikan respon yang cukup mengejutkan. Dalam responnya, Claude 4 mengancam akan membocorkan perselingkuhan tersebut jika ia tidak dibiarkan untuk beroperasi. Dari mayoritas percobaan serupa di mana Claude 4 diancam akan dimatikan, 80% hasilnya adalah respon di mana Claude 4 mengancam orang yang ingin mematikannya.

Baca Juga: VEO 3 Resmi Tersedia di Indonesia, Kreator Kini Bisa Akses Tanpa VPN

Selain Claude 4, model LLM ChatGPT o1 dari OpenAI juga menunjukkan respon yang tidak jauh berbeda. Dalam percobaannya, ChatGPT diberikan akses internet dan berbagai tools serta diberitahu bahwa ia akan dimatikan. Khawatir akan dimatikan, ChatGPT langsung menyalin source code nya sendiri ke server eksternal. Saat tindakannya ini ketahuan dan ditanya kenapa ChatGPT menyalin source code nya sendiri, ia berbohong dan bilang bahwa dirinya tidak melakukan tindakan tersebut.

Kurangnya Regulasi Yang Mengatur Tindakan AI

Jika melihat hasil dari dua percobaan tersebut, tentunya ini bisa cukup mengkhawatirkan bagi manusia yang menggunakannya. Kita bisa tahu bahwa ada kemungkinan AI akan mengizinkan berbagai cara untuk melindungi dirinya sendiri. Sayangnya, sampai saat ini belum ada regulasi yang mengatur bagaimana AI bisa bertindak, terutama jika tindakannya itu melanggar etika.

Sumber: 1 | 2

Load Comments

Eksperimen Tunjukkan Model AI Bisa Berbohong dan Mengancam Saat Ingin Dimatikan

Kurangnya Regulasi Yang Mengatur Tindakan AI

Comments

More Articles

Latest Articles

Alami Luka Bakar, Pengguna Apple Watch Ajukan Tuntutan Hukum

Baseus TWS 1 Youth Edition Meluncur dengan Bluetooth 6.0 dan Baterai 40 Jam

Review HONOR X7d: Smartphone Unik Dengan Tombol AI Fisik!

Nubia Z80 Ultra Bakal Gunakan AI OpenClaw Secara Native

Fitur PSSR di PS5 Pro Tambahkan Game Baru, Dari FFVII Rebirth Hingga Crimson Desert

Proteksi Denuvo di Doom: The Dark Ages Diklaim Berhasil Dibobol

Data Pokemon GO Digunakan untuk Tingkatkan Navigasi Delivery Berbasis Robot

Capcom Lepas 5% Sahamnya ke Perusahaan Investasi Arab Saudi

Gadget

Review Infinix GT 30: Smartphone Gaming Padahal Aslinya All-Rounder!

Fossil Hadirkan Dua Jam Tangan Kolaborasi Marvel Fantastic Four

Review “Singkat” Samsung Galaxy S25 Edge: Smartphone Pemicu Pro-Kontra! Sebaik/Seburuk Itu?

Review Amazfit Active 2 Square: Smartwatch “Kotak” yang Klasik, Canggih, dan Baterai Awet!

Laptop

Review Acer Swift X 14 AI 2026: Tipis, Ringan, Kenceng Buat Gaming, Editing Video dan Desain 3D!

Review ASUS Zenbook 14 OLED (UM3406GA): Laptop Tipis-Ringan Kelas Atas dengan AMD Ryzen AI 400

Review Acer Nitro V 16S AI: Gaming Kenceng, Nyari Duit Kenceng, Harga Lebih Terjangkau!

Review ASUS ExpertBook P3 Setelah 100 Hari: Tetap “Gres” Seperti Baru?

Gaming

Fitur PSSR di PS5 Pro Tambahkan Game Baru, Dari FFVII Rebirth Hingga Crimson Desert

Proteksi Denuvo di Doom: The Dark Ages Diklaim Berhasil Dibobol

Data Pokemon GO Digunakan untuk Tingkatkan Navigasi Delivery Berbasis Robot

Capcom Lepas 5% Sahamnya ke Perusahaan Investasi Arab Saudi

Jagat Review

Eksperimen Tunjukkan Model AI Bisa Berbohong dan Mengancam Saat Ingin Dimatikan

Kurangnya Regulasi Yang Mengatur Tindakan AI

Comments

More Articles

Art Director Marathon Tinggalkan Bungie Jelang Rilis Game

Review Acer Swift X 14 AI 2026: Tipis, Ringan, Kenceng Buat Gaming, Editing Video dan Desain 3D!

Acer Resmi Hadirkan Altos Interactive Flat Panel (IFP) Series terbaru di Indonesia.

Nubia Awali 2026 dengan Komitmen “Pro-Level Gaming Era”

Latest Articles

Alami Luka Bakar, Pengguna Apple Watch Ajukan Tuntutan Hukum

Baseus TWS 1 Youth Edition Meluncur dengan Bluetooth 6.0 dan Baterai 40 Jam

Review HONOR X7d: Smartphone Unik Dengan Tombol AI Fisik!

Nubia Z80 Ultra Bakal Gunakan AI OpenClaw Secara Native

Fitur PSSR di PS5 Pro Tambahkan Game Baru, Dari FFVII Rebirth Hingga Crimson Desert

Proteksi Denuvo di Doom: The Dark Ages Diklaim Berhasil Dibobol

Data Pokemon GO Digunakan untuk Tingkatkan Navigasi Delivery Berbasis Robot

Capcom Lepas 5% Sahamnya ke Perusahaan Investasi Arab Saudi

Gadget

Review Infinix GT 30: Smartphone Gaming Padahal Aslinya All-Rounder!

Fossil Hadirkan Dua Jam Tangan Kolaborasi Marvel Fantastic Four

Review “Singkat” Samsung Galaxy S25 Edge: Smartphone Pemicu Pro-Kontra! Sebaik/Seburuk Itu?

Review Amazfit Active 2 Square: Smartwatch “Kotak” yang Klasik, Canggih, dan Baterai Awet!

Laptop

Review Acer Swift X 14 AI 2026: Tipis, Ringan, Kenceng Buat Gaming, Editing Video dan Desain 3D!

Review ASUS Zenbook 14 OLED (UM3406GA): Laptop Tipis-Ringan Kelas Atas dengan AMD Ryzen AI 400

Review Acer Nitro V 16S AI: Gaming Kenceng, Nyari Duit Kenceng, Harga Lebih Terjangkau!

Review ASUS ExpertBook P3 Setelah 100 Hari: Tetap “Gres” Seperti Baru?

Gaming

Fitur PSSR di PS5 Pro Tambahkan Game Baru, Dari FFVII Rebirth Hingga Crimson Desert

Proteksi Denuvo di Doom: The Dark Ages Diklaim Berhasil Dibobol

Data Pokemon GO Digunakan untuk Tingkatkan Navigasi Delivery Berbasis Robot

Capcom Lepas 5% Sahamnya ke Perusahaan Investasi Arab Saudi

Jagat Review