B站导航
  • 首页
  • AI技术
      未登录
      登录后即可体验更多功能

      模型测评工具

      共 13 篇网址
      排序
      发布更新浏览点赞
      PubMedQA

      PubMedQA

      生物医学问答数据集
      40
      模型测评工具# 模型测评工具
      H2O EvalGPT

      H2O EvalGPT

      基于LLM的评估工具
      40
      模型测评工具# 模型测评工具
      LLMEval3

      LLMEval3

      用于评估大模型的工具
      50
      模型测评工具# 模型测评工具
      HELM

      HELM

      语言模型评估工具
      50
      模型测评工具# 模型测评工具
      MMBench

      MMBench

      评估LVLMs的工具
      50
      模型测评工具# 模型测评工具
      CMMLU

      CMMLU

      综合性的中文评估基准
      60
      模型测评工具# 模型测评工具
      OpenCompass

      OpenCompass

      开源大模型评估平台
      50
      模型测评工具# 模型测评工具
      AGI-Eval

      AGI-Eval

      AI大模型评测社区
      40
      模型测评工具# 模型测评工具
      SuperCLUE

      SuperCLUE

      中文大模型测评基准
      40
      模型测评工具# 模型测评工具
      FlagEval

      FlagEval

      AI大模型的评估工具包
      70
      模型测评工具# 模型测评工具
      C-Eval

      C-Eval

      中文基础模型评估套件
      40
      模型测评工具# 模型测评工具
      MMLU

      MMLU

      多任务语言理解基准工具
      50
      模型测评工具# 模型测评工具
      Open LLM Leaderboard

      Open LLM Leaderboard

      开源大模型排行榜单
      40
      模型测评工具# 模型测评工具
      没有了
      B站导航
      B站导航 ,集网址、资源、资讯于一体的 综合网址导航站,简约优雅的设计风格,全面的前端用户功能,简单的模块化配置,欢迎您的体验

      提交收录免责声明广告合作关于我们隐私政策

      扫码加QQ群B站导航
      扫码加QQ群
      扫码加微信B站导航
      扫码加微信
      Copyright © 2026 B站导航 豫ICP备18041986号-6 网站地图 | 技术导航
      反馈
      让我们一起共建文明社区!您的反馈至关重要!
      网址
      网址文章软件书籍