Tag
#LLM benchmark
2 artigos

modelos
Meta apresenta Muse Spark: o que o primeiro modelo público do Superintelligence Lab revela sobre a corrida da IA
Meta lança Muse Spark, primeiro modelo do Superintelligence Lab. Benchmarks impressionam, mas lacunas em agenticidade geram debate. Impacto na América Latina.

modelos
Google lança Android Bench: Gemini lidera ranking de IAs para desenvolvimento Android
Google lança Android Bench, ranking oficial para avaliar IAs no desenvolvimento Android. Gemini 3.1 Pro Preview lidera a primeira edição.