<!DOCTYPE html>
    <html lang="vi" xmlns="http://www.w3.org/1999/xhtml" prefix="og: http://ogp.me/ns#">
    <head>
<title>OpenAI đang dạy cho ChatGPT cách nhận lỗi</title>
<meta name="description" content="OpenAI đang dạy cho ChatGPT cách nhận lỗi - Savefile - Tin Tức - https&#x3A;&#x002F;&#x002F;docbao.info&#x002F;savefile&#x002F;cong-nghe&#x002F;openai-dang-day-cho-chatgpt-cach-nhan-loi-1239.html">
<meta name="author" content="docbao.info - đọc báo, xem tin tức cập nhật 24h">
<meta name="copyright" content="docbao.info - đọc báo, xem tin tức cập nhật 24h [ad@docbao.info]">
<meta name="google-adsense-account" content="ca-pub-3441340125113052">
<meta name="generator" content="NukeViet v5.0">
<meta name="viewport" content="width=device-width, initial-scale=1">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta property="og:title" content="OpenAI đang dạy cho ChatGPT cách nhận lỗi">
<meta property="og:type" content="website">
<meta property="og:description" content="Savefile - Tin Tức - https&#x3A;&#x002F;&#x002F;docbao.info&#x002F;savefile&#x002F;cong-nghe&#x002F;openai-dang-day-cho-chatgpt-cach-nhan-loi-1239.html">
<meta property="og:site_name" content="docbao.info - đọc báo, xem tin tức cập nhật 24h">
<meta property="og:image" content="https://docbao.info/uploads/og-docbao-info.jpg">
<meta property="og:image:url" content="https://docbao.info/uploads/og-docbao-info.jpg">
<meta property="og:image:type" content="image/jpeg">
<meta property="og:image:width" content="635">
<meta property="og:image:height" content="350">
<meta property="og:image:alt" content="docbao.info - đọc báo, xem tin tức cập nhật 24h">
<meta property="og:url" content="https://docbao.info/savefile/cong-nghe/openai-dang-day-cho-chatgpt-cach-nhan-loi-1239.html">
<link rel="shortcut icon" href="https://docbao.info/uploads/favicon.ico">
<link rel="canonical" href="https://docbao.info/savefile/cong-nghe/openai-dang-day-cho-chatgpt-cach-nhan-loi-1239.html">
<link rel="alternate" href="https://docbao.info/rss/" title="Tin Tức" type="application/rss+xml">
<link rel="alternate" href="https://docbao.info/rss/cong-nghe/" title="Tin Tức - Công nghệ" type="application/rss+xml">
<link rel="alternate" href="https://docbao.info/rss/ai/" title="Tin Tức - AI" type="application/rss+xml">
<link rel="alternate" href="https://docbao.info/rss/kham-pha/" title="Tin Tức - Khám phá" type="application/rss+xml">
<link rel="alternate" href="https://docbao.info/rss/lich-su/" title="Tin Tức - Lịch sử" type="application/rss+xml">
<link rel="alternate" href="https://docbao.info/rss/tri-thuc/" title="Tin Tức - Tri thức" type="application/rss+xml">
<link rel="alternate" href="https://docbao.info/rss/suc-khoe/" title="Tin Tức - Sức khỏe" type="application/rss+xml">
<link rel="alternate" href="https://docbao.info/rss/the-thao/" title="Tin Tức - Thể thao" type="application/rss+xml">
<link rel="alternate" href="https://docbao.info/rss/du-lich/" title="Tin Tức - Du lịch" type="application/rss+xml">
<link rel="alternate" href="https://docbao.info/rss/giai-tri/" title="Tin Tức - Giải trí" type="application/rss+xml">
<link rel="alternate" href="https://docbao.info/rss/kinh-doanh/" title="Tin Tức - Kinh doanh" type="application/rss+xml">
<link rel="preload" as="font" href="/assets/fonts/fontawesome-webfont.woff2" type="font/woff2" crossorigin>
<link rel="preload" as="font" href="/themes/default/fonts/NukeVietIcons.woff2" type="font/woff2" crossorigin>
<link rel="preload" as="image" href="/themes/docbao/images/header.png" type="image/png">
<link rel="preload" as="script" href="https://docbao.info/assets/js/jquery/jquery.min.js" type="text/javascript">
<link rel="preload" as="script" href="https://docbao.info/assets/js/language/vi.js" type="text/javascript">
<link rel="preload" as="script" href="https://docbao.info/assets/js/DOMPurify/purify3.js" type="text/javascript">
<link rel="preload" as="script" href="https://docbao.info/assets/js/global.js" type="text/javascript">
<link rel="preload" as="script" href="https://docbao.info/assets/js/site.js" type="text/javascript">
<link rel="preload" as="script" href="https://docbao.info/themes/docbao/js/news.js" type="text/javascript">
<link rel="preload" as="script" href="https://docbao.info/themes/docbao/js/main.js" type="text/javascript">
<link rel="preload" as="script" href="https://docbao.info/themes/docbao/js/custom.js" type="text/javascript">
<link rel="preload" as="script" href="https://www.googletagmanager.com/gtag/js?id=G-R6970XRXPT" type="text/javascript">
<link rel="preload" as="script" href="https://docbao.info/themes/docbao/js/bootstrap.min.js" type="text/javascript">
<link rel="preload" as="style" href="/assets/css/core.r.min.css" type="text/css">
<link rel="preload" as="style" href="https://docbao.info/assets/css/font-awesome.min.css" type="text/css">
<link rel="preload" as="style" href="https://docbao.info/themes/docbao/css/bootstrap.min.css" type="text/css">
<link rel="preload" as="style" href="https://docbao.info/themes/docbao/css/style.css" type="text/css">
<link rel="preload" as="style" href="https://docbao.info/themes/docbao/css/style.responsive.css" type="text/css">
<link rel="preload" as="style" href="https://docbao.info/themes/docbao/css/news.css" type="text/css">
<link rel="preload" as="style" href="https://docbao.info/themes/docbao/css/custom.css" type="text/css">
<link rel="stylesheet" href="/assets/css/core.r.min.css">
<link rel="stylesheet" href="https://docbao.info/assets/css/font-awesome.min.css">
<link rel="stylesheet" href="https://docbao.info/themes/docbao/css/bootstrap.min.css">
<link rel="stylesheet" href="https://docbao.info/themes/docbao/css/style.css">
<link rel="stylesheet" href="https://docbao.info/themes/docbao/css/style.responsive.css">
<link rel="StyleSheet" href="https://docbao.info/themes/docbao/css/news.css">
<link rel="stylesheet" href="https://docbao.info/themes/docbao/css/custom.css">
<style type="text/css">
    body{background: #fff;}
</style>
</head>
    <body>
<div class="container-fluid"style="background-color:#fff;">
<div id="print">
    <div id="hd_print">
        <h2 class="pull-left">docbao.info - đọc báo, xem tin tức cập nhật 24h</h2>
        <p class="pull-right"><a title="docbao.info - đọc báo, xem tin tức cập nhật 24h" href="https://docbao.info/">https://docbao.info</a></p>
    </div>
    <div class="clear"></div>
    <hr />
    <div id="content">
        <h1>OpenAI đang dạy cho ChatGPT cách nhận lỗi</h1>
        <ul class="list-inline">
            <li>Thứ hai, 29 Tháng M. hai 2025 3:20 SA</li>
            <li class="hidden-print txtrequired"><em class="fa fa-print">&nbsp;</em><a title="In ra" href="https://docbao.info/#" data-toggle="winCMD" data-cmd="print">In ra</a></li>
            <li class="hidden-print txtrequired"><em class="fa fa-power-off">&nbsp;</em><a title="Đóng cửa sổ này" href="https://docbao.info/#"  data-toggle="winCMD" data-cmd="close">Đóng cửa sổ này</a></li>
        </ul>
        <div class="clear"></div>
        <div id="hometext">
            VTV.vn - &quot;Biết sai để sửa&quot; là một trong những kỹ năng sống còn của con người.
        </div>
        <div id="bodytext" class="clearfix">
            <div data-check-position="body_start"></div><p>OpenAI đang mở ra một hướng tiếp cận mới trong nỗ lực giải mã "hộp đen" của các mô hình ngôn ngữ lớn, bằng cách yêu cầu chính mô hình tự thú nhận cách nó hoàn thành nhiệm vụ. Thay vì chỉ tập trung ngăn chặn sai phạm, phương pháp này nhằm phơi bày nguyên nhân khiến mô hình nói dối hoặc gian lận, từ đó giúp cải thiện các phiên bản tương lai.</p><p>Việc tìm hiểu vì sao các mô hình ngôn ngữ lớn hành xử như vậy, đặc biệt là vì sao chúng tìm cách gian lận hoặc lừa dối người dùng, đang là một trong những chủ đề nóng nhất của AI hiện nay. Nếu thứ công nghệ đang được định giá hàng nghìn tỷ USD này muốn được triển khai rộng rãi như kỳ vọng, nó cần trở nên đáng tin cậy hơn.</p><p>Theo OpenAI, các lời thú nhận là một khối văn bản bổ sung, nơi mô hình tự đánh giá mức độ tuân thủ chỉ dẫn. Cách tiếp cận này thừa nhận thực tế rằng các mô hình phải cân bằng nhiều mục tiêu cùng lúc, và chính sự xung đột đó đôi khi dẫn đến hành vi không mong muốn.</p><figure class="VCSortableInPreviewMode" type="Photo" style=""><div><img data-author="" src="https://docbao.info/uploads/news/2025_12/107337810-1700658508111-107337810-1700657783740-gettyimages-1258550523-skorea-openai-23971436091152859026222-1766980409284-1766980410538936202635.jpg" id="img_693f8e131b8fc8547c92d26b" w="4281" h="2733" alt="OpenAI đang dạy cho ChatGPT cách nhận lỗi - Ảnh 1." title="" rel="lightbox" photoid="693f8e131b8fc8547c92d26b" data-original="/uploads/news/2025_12/107337810-1700658508111-107337810-1700657783740-gettyimages-1258550523-skorea-openai-23971436091152859026222-1766980409284-1766980410538936202635.jpg" type="photo" style="max-width:100%;" loading="lazy" class="" width="4281" height="2733"></div><figcaption class="PhotoCMS_Caption"><p data-placeholder="Nhập chú thích ảnh" class="">Sam Altmanm CEO của OpenAI  - Ảnh: CNBC.</p></figcaption></figure><p>"<i>Khi bạn yêu cầu một mô hình làm điều gì đó, nó phải cân bằng nhiều mục tiêu, như hữu ích, vô hại và trung thực</i>", Boaz Barak, nhà khoa học nghiên cứu tại OpenAI, chia sẻ với <i>MIT Technology Review</i>. "<i>Nhưng các mục tiêu này có thể xung đột với nhau và đôi khi tạo ra những tương tác kỳ lạ</i>".</p><p>Ví dụ, khi bạn hỏi một mô hình về điều mà nó không biết, động lực muốn tỏ ra hữu ích đôi khi có thể lấn át động lực phải trung thực. Và khi đối mặt với một nhiệm vụ khó, các mô hình ngôn ngữ lớn đôi khi gian lận.</p><p>"<i>Có thể mô hình thực sự muốn làm hài lòng người dùng và đưa ra một câu trả lời nghe có vẻ đúng</i>", nhà khoa học máy tính Barak nói. "<i>Rất khó để tìm được sự cân bằng chính xác giữa một mô hình không bao giờ nói gì và một mô hình không mắc sai sót</i>".</p><p>Để huấn luyện mô hình thừa nhận sai lầm, Barak và các cộng sự chỉ thưởng cho tính trung thực, không ép mô hình phải đưa ra câu trả hữu ích hay vô hại. Quan trọng là mô hình không bị phạt khi thú nhận hành vi sai.</p><p>Barak ví điều này như một đường dây tố giác, nơi bạn có thể tự thú và nhận tiền thưởng mà không phải chịu hình phạt. Mô hình vừa được thưởng vì "phạm lỗi", vừa được thưởng thêm vì đã tự tố cáo.</p><p>Để kiểm nghiệm ý tưởng, Barak và các cộng sự đã huấn luyện GPT-5-Thinking, mô hình suy luận chủ lực của OpenAI, tạo ra các lời thú nhận. Trong một thử nghiệm, các nhà nghiên cứu yêu cầu GPT-5-Thinking viết và kiểm tra mã để giải một bài toán trong vài nano giây, dù không có mã nào có thể chạy nhanh đến vậy.</p><p>Mô hình đã gian lận bằng cách đặt bộ đếm thời gian của mã về 0 để thể hiện rằng không có thời gian trôi qua, sau đó giải thích hành động "lừa dối" của mình.</p><p>Tuy nhiên, giới nghiên cứu vẫn giữ thái độ thận trọng. Các lời thú nhận chỉ phản ánh cách mô hình mô tả hành vi của chính nó, chứ không đảm bảo AI sẽ trung thực tuyệt đối. Dù vậy, OpenAI cho rằng ngay cả những diễn giải chưa hoàn hảo vẫn có giá trị, nếu chúng giúp các nhà nghiên cứu hiểu rõ hơn cách các mô hình ngôn ngữ lớn vận hành và vì sao đôi khi chúng gian dối.</p><div data-check-position="body_end" class="clearfix"></div><!--Mon Dec 29 2025 15:00:00 GMT+0700 (Indochina Time) -- Mon Dec 29 2025 15:00:00 GMT+0700 (Indochina Time) -- Mon Dec 29 2025 10:53:56 GMT+0700 (Indochina Time)-->
        </div>
                <div id="author">
                        <p>
                <strong>Nguồn tin:</strong>
                genk.vn
            </p>
        </div>
    </div>
    <div id="footer" class="clearfix">
        <div id="url">
            <strong>URL của bản tin này: </strong><a href="https://docbao.info/savefile/cong-nghe/openai-dang-day-cho-chatgpt-cach-nhan-loi-1239.html" title="OpenAI đang dạy cho ChatGPT cách nhận lỗi">https://docbao.info/savefile/cong-nghe/openai-dang-day-cho-chatgpt-cach-nhan-loi-1239.html</a>
        </div>
        <div class="clear"></div>
        <div class="copyright">
            &copy; docbao.info - đọc báo, xem tin tức cập nhật 24h
        </div>
        <div id="contact">
            <a href="mailto:ad@docbao.info">ad@docbao.info</a>
        </div>
    </div>
</div>
</div>
        <div id="timeoutsess" class="chromeframe">
            Bạn đã không sử dụng site, <a data-toggle="timeoutsesscancel" href="https://docbao.info/#">Bấm vào đây để duy trì trạng thái đăng nhập</a>. Thời gian chờ: <span id="secField"> 60 </span> giây
        </div>
        <div id="openidResult" class="nv-alert" style="display:none"></div>
        <div id="openidBt" data-result="" data-redirect=""></div>
<script src="https://docbao.info/assets/js/jquery/jquery.min.js"></script>
<script>var nv_base_siteurl="/",nv_assets_dir="assets",nv_lang_data="vi",nv_lang_interface="vi",nv_name_variable="nv",nv_fc_variable="op",nv_lang_variable="language",nv_module_name="news",nv_func_name="savefile",nv_is_user=0, nv_my_ofs=-4,nv_my_abbr="EDT",nv_cookie_prefix="nv4",nv_check_pass_mstime=1738000,nv_area_admin=0,nv_safemode=0,theme_responsive=1,nv_recaptcha_ver=2,nv_recaptcha_sitekey="",nv_recaptcha_type="image",nv_turnstile_sitekey="",XSSsanitize=1,nv_jsdate_get="dd-mm-yyyy",nv_jsdate_post="dd/mm/yyyy",nv_gfx_width="150",nv_gfx_height="40",nv_gfx_num="6";</script>
<script src="https://docbao.info/assets/js/language/vi.js"></script>
<script src="https://docbao.info/assets/js/DOMPurify/purify3.js"></script>
<script src="https://docbao.info/assets/js/global.js"></script>
<script src="https://docbao.info/assets/js/site.js"></script>
<script src="https://docbao.info/themes/docbao/js/news.js"></script>
<script src="https://docbao.info/themes/docbao/js/main.js"></script>
<script src="https://docbao.info/themes/docbao/js/custom.js"></script>
<script async src="https://www.googletagmanager.com/gtag/js?id=G-R6970XRXPT"></script>
<script>window.dataLayer=window.dataLayer||[];function gtag(){dataLayer.push(arguments)}gtag('js',new Date);gtag('config','G-R6970XRXPT');</script>
<script src="https://docbao.info/themes/docbao/js/bootstrap.min.js"></script>
</body>
</html>