Samsung wprowadza TRUEBench: porównywarkę rzeczywistej produktywności sztucznej inteligencji
Autorska porównywarka opracowana przez dział Samsung Research obsługuje wielojęzyczne scenariusze produktywności, wypełniając luki w istniejących testach sztucznej inteligencji Samsung prezentuje porównywarkę TRUEBench (Trustworthy Real-world Usage Evaluation Benchmark) opracowaną przez dział Samsung Research w celu prowadzenia ocen produktywności sztucznej inteligencji. Porównywarka zawiera kompleksowy zestaw wskaźników do analizy sprawności dużych modeli językowych (LLM) w rzeczywistych zastosowaniach służących