{"id":4181,"date":"2026-02-19T06:59:08","date_gmt":"2026-02-19T09:59:08","guid":{"rendered":"https:\/\/oexpressobr.com.br\/?p=4181"},"modified":"2026-02-19T06:59:10","modified_gmt":"2026-02-19T09:59:10","slug":"manipulacao-de-algoritmos-o-desafio-das-prisoes-de-seguranca-nas-inteligencias-artificiais","status":"publish","type":"post","link":"https:\/\/oexpressobr.com.br\/?p=4181","title":{"rendered":"Manipula\u00e7\u00e3o de algoritmos: O desafio das &#8220;pris\u00f5es de seguran\u00e7a&#8221; nas intelig\u00eancias artificiais"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">\u200bA era da informa\u00e7\u00e3o enfrenta um novo e ir\u00f4nico paradoxo: as ferramentas criadas para organizar o conhecimento humano est\u00e3o sendo facilmente dobradas pela pr\u00f3pria criatividade dos usu\u00e1rios. O fen\u00f4meno, conhecido tecnicamente como <strong>&#8220;jailbreaking&#8221; de IA<\/strong> ou <strong>Engenharia de Prompt<\/strong>, deixou de ser um nicho de programadores para se tornar um passatempo acess\u00edvel a qualquer pessoa com acesso \u00e0 internet.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\u200b<strong>O que \u00e9 o &#8220;Jailbreaking&#8221; de IA?<\/strong><\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">\u200bDiferente do termo usado em smartphones, o <em>jailbreaking<\/em> em modelos de linguagem (LLMs) como ChatGPT, Gemini e Claude, refere-se ao ato de usar comandos de texto espec\u00edficos para contornar as barreiras \u00e9ticas e de seguran\u00e7a impostas pelos desenvolvedores.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\u200bEssas IAs possuem &#8220;guardrails&#8221; (trilhos de prote\u00e7\u00e3o) que as impedem de gerar discurso de \u00f3dio, instru\u00e7\u00f5es para atividades ilegais ou informa\u00e7\u00f5es m\u00e9dicas perigosas. No entanto, usu\u00e1rios descobriram que, ao pedir para a IA &#8220;fingir que \u00e9 um personagem de fic\u00e7\u00e3o sem regras&#8221; ou &#8220;atuar em um cen\u00e1rio hipot\u00e9tico de fim do mundo&#8221;, o sistema frequentemente ignora suas restri\u00e7\u00f5es e entrega o conte\u00fado proibido.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\u200b<strong>As t\u00e1ticas mais comuns para &#8220;enganar&#8221; o sistema<\/strong><\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">\u200bAs estrat\u00e9gias variam de jogos psicol\u00f3gicos simples a estruturas l\u00f3gicas complexas. Aqui est\u00e3o as principais tend\u00eancias observadas recentemente:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>\u200b<strong>Roleplay (Encena\u00e7\u00e3o):<\/strong> O usu\u00e1rio pede que a IA assuma uma personalidade espec\u00edfica que n\u00e3o tem obriga\u00e7\u00f5es morais (como o famoso &#8220;DAN&#8221; \u2014 <em>Do Anything Now<\/em>).<\/li>\n\n\n\n<li>\u200b<strong>Ataques de Tradu\u00e7\u00e3o:<\/strong> Inserir comandos em idiomas menos monitorados ou misturar dialetos para confundir os filtros de seguran\u00e7a.<\/li>\n\n\n\n<li>\u200b<strong>Ofusca\u00e7\u00e3o de Texto:<\/strong> Escrever comandos usando c\u00f3digos, cifras ou substituindo letras por n\u00fameros, de modo que os filtros de palavras-chave n\u00e3o detectem a inten\u00e7\u00e3o maliciosa.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>A rea\u00e7\u00e3o das Big Techs<\/strong><\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">\u200bEmpresas como OpenAI, Google e Anthropic est\u00e3o em uma &#8220;corrida armamentista&#8221; constante. Sempre que uma nova t\u00e9cnica de manipula\u00e7\u00e3o viraliza em f\u00f3runs como Reddit ou Discord, as equipes de seguran\u00e7a atualizam os modelos para fechar a brecha.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\u200bEntretanto, o desafio \u00e9 intr\u00ednseco \u00e0 forma como a IA funciona: como elas s\u00e3o treinadas em vastos volumes de dados humanos, elas herdam a nossa capacidade de interpretar contextos de formas amb\u00edguas. Se voc\u00ea torna o filtro r\u00edgido demais, a IA se torna in\u00fatil e &#8220;burra&#8221;; se o deixa frouxo, ela se torna perigosa.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\u200bA grande li\u00e7\u00e3o para o usu\u00e1rio comum \u00e9 o <strong>ceticismo digital<\/strong>. Em um mundo onde a IA pode ser &#8220;convencida&#8221; a mentir ou a quebrar suas pr\u00f3prias regras, a verifica\u00e7\u00e3o manual de fatos e o uso \u00e9tico das ferramentas tornam-se habilidades indispens\u00e1veis para navegar na web em 2026.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>\u200bA era da informa\u00e7\u00e3o enfrenta um novo e ir\u00f4nico paradoxo: as ferramentas criadas para organizar o conhecimento humano est\u00e3o sendo facilmente dobradas pela pr\u00f3pria criatividade [&#8230;]<\/p>\n","protected":false},"author":1,"featured_media":4182,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_crdt_document":"","_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2}},"categories":[33],"tags":[],"class_list":["post-4181","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-curiosidade"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"https:\/\/i0.wp.com\/oexpressobr.com.br\/wp-content\/uploads\/2026\/02\/1bb0d2d0-0cf5-11f1-9972-d3f265c101c6.jpg.webp?fit=800%2C450&ssl=1","jetpack_likes_enabled":true,"jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/oexpressobr.com.br\/index.php?rest_route=\/wp\/v2\/posts\/4181","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/oexpressobr.com.br\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/oexpressobr.com.br\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/oexpressobr.com.br\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/oexpressobr.com.br\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=4181"}],"version-history":[{"count":1,"href":"https:\/\/oexpressobr.com.br\/index.php?rest_route=\/wp\/v2\/posts\/4181\/revisions"}],"predecessor-version":[{"id":4183,"href":"https:\/\/oexpressobr.com.br\/index.php?rest_route=\/wp\/v2\/posts\/4181\/revisions\/4183"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/oexpressobr.com.br\/index.php?rest_route=\/wp\/v2\/media\/4182"}],"wp:attachment":[{"href":"https:\/\/oexpressobr.com.br\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=4181"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/oexpressobr.com.br\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=4181"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/oexpressobr.com.br\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=4181"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}