Tag
#UC Berkeley
3 artigos

ferramentas
IBM e UC Berkeley diagnosticam por que agentes de IA empresariais falham com IT-Bench e MAST
Pesquisa de IBM e UC Berkeley revela que 70% dos agentes de IA empresariais falham em 6 meses. Novo benchmark IT-Bench e diagnóstico MAST identificam causas raiz.

modelos
Os estudantes de PhD que viraram árbitros da indústria de IA
Estudantes de PhD da UC Berkeley criaram a Arena, ferramenta que se tornou o ranking definitivo para modelos de IA. Em 7 meses, mudou a indústria.

modelos
Arena: a polêmica leaderboard que define o futuro dos LLMs e divide o mercado de IA
Arena, formerly LM Arena, became the de facto LLM leaderboard funded by the companies it ranks, raising conflict of interest concerns in the AI market.