Início Tecnologia Claude Fable da Anthropic é uma versão do Mythos que o público...

Claude Fable da Anthropic é uma versão do Mythos que o público pode acessar hoje

24
0

A Anthropic está trazendo seu modelo de IA mais poderoso ao público em geral pela primeira vez, mas está fazendo isso com grades de proteção.

Na terça-feira, a empresa de IA lançou Claude Fable 5, a primeira versão disponível publicamente do seu modelo Mythos. A Anthropic diz que o Fable 5 é excelente em engenharia de software program, trabalho de conhecimento e visão, mas vem com limites rígidos de segurança. Em áreas de alto risco como segurança cibernética, biologia, química e destilação, o modelo bloqueia respostas e recorre a Claude Opus 4.8.

Lançado como uma prévia em abril, o Mythos foi inicialmente limitado a um punhado de parceiros devido a questões de segurança cibernética. Na semana passada, a Anthropic expandiu o acesso a centenas de organizações em 15 países, concentrando-se novamente em organizações que gerem infraestruturas críticas.

Agora, uma versão dessa tecnologia está disponível para qualquer pessoa por meio da API Claude da Anthropic e de planos empresariais baseados em consumo. O acesso às assinaturas será implementado em etapas: até 22 de junho, o Fable 5 estará incluído nos planos Professional, Max, Workforce e Enterprise por assento, sem custo further. Em 23 de junho, a Anthropic retirará o Fable 5 desses planos, exigindo créditos de uso daqui para frente, com planos de restaurá-lo como um recurso de assinatura padrão o mais rápido possível.

A Anthropic também está implantando uma nova versão do Mythos, chamada Mythos 5, para organizações que já foram aprovadas para acessar o modelo avançado.

O lançamento da Fable ocorre no momento em que a Anthropic se prepara para entrar nos mercados públicos, ao lado da OpenAI e da SpaceX de Elon Musk. Também segue o Apelo da empresa de IA instando os principais laboratórios globais de IA a estabelecerem um freio coordenado no desenvolvimento de IA de ponta. A Anthropic alertou que os sistemas estão avançando tão rapidamente que poderão em breve alcançar o autoaperfeiçoamento recursivo (RSI), melhorando-se de forma autônoma, sem intervenção humana.

Desconfiada do que um modelo da classe Mythos poderia fazer nas mãos erradas, a Anthropic diz que testou seus classificadores com tentativas de jailbreak antes de lançar o Fable 5.

“Internamente, executamos uma recompensa externa por bugs que não produziu jailbreaks universais em mais de 1.000 horas de testes. Em seguida, trabalhamos com organizações externas de equipes vermelhas que também não conseguiram encontrar jailbreaks universais.”

Dito isto, ainda pode haver novos ataques possíveis. Como resultado, com o lançamento do Fable 5 e do Mythos 5, a Anthropic disse que exigirá uma retenção de 30 dias em todo o tráfego, mesmo que as empresas anteriormente tivessem acordos de retenção zero. A Antthropic disse que não usará os dados para treinamento, apenas para “defesa contra ataques complexos e novos, incluindo novos jailbreaks” e “identificar e reduzir falsos positivos”. A política poderia estabelecer um precedente na indústria em que o acesso a modelos cada vez mais poderosos vem com políticas obrigatórias de retenção de dados enquadradas como uma medida de segurança.

Para aqueles que continuam a usar o modelo, nem todas as perguntas receberão uma resposta do Fable 5. A Anthropic diz que os casos em que o Fable tem que adiar para o Opus 4.8 são raros, com dados iniciais mostrando pelo menos 95% das sessões do Fable rodando inteiramente com base nas próprias respostas do modelo.

Em testes de terceiros, a empresa de análise Hex disse em um comunicado que a Fable foi a primeira a obter 90% em seu benchmark analítico principal de tarefas analíticas complexas e de longa duração.

“Nas questões mais difíceis, mostra forte julgamento e atenção às nuances”, disse Hex.

A plataforma de codificação Vibe Base44 observou em um comunicado que Fable é melhor em “aplicativos completos e únicos” e tem excelente chamada de ferramentas. Espaço de trabalho e plataforma de agente com tecnologia de IA Genspark disse que Fable superou todos os outros modelos em suas avaliações e teve um desempenho significativamente melhor em tarefas como design de interface do usuário e codificação de jogos.

O preço do Fable 5 e do Mythos 5 é de US$ 10 por milhão de tokens de entrada e US$ 50 por milhão de tokens de saída, o dobro do preço do Opus 4.8. Esse preço por si só poderia servir como um impedimento para o uso generalizado.

Muitas empresas estão cada vez mais críticas em relação aos custos de IA depois de verem as contas chegarem ou estourarem seus orçamentos anuais de IA antecipadamente. Modelos avançados como o Opus 4.8 podem agravar esses problemas, com habilidades de raciocínio avançadas que podem dividir uma única solicitação em múltiplas tarefas.

A Anthropic disse que espera que a demanda por Fable 5 seja muito alta e difícil de prever. E, de fato, alguns, como a plataforma de recompensas de compras Rakuten, podem pensar que a vantagem vale o preço.

“Com o maior esforço, a Fable reflete e valida seu próprio trabalho”, disse Rakuten em comunicado. “Para nós, é isso que torna possíveis operações altamente autônomas – o pensamento further se paga.”

Quando você compra por meio de hyperlinks em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui