- RESOURCES -

AI Titans Compared: Meta’s Llama 3.1 70B vs Mistral Large 2 128B Review | by alex buzunov | Jul, 2024 | Medium
Meta’s Llama 3.1 70B and Mistral Large 2 128B represent two prominent large language models (LLMs) that have made significant strides in the field of artificial intelligence. These models are…......
medium.com
从零实现大模型-RLHF:Reinforcement Learning from Human Feedback-AI.x-AIGC专属社区-51CTO.COM
从零实现大模型多头注意力和Transformer从零实现大模型GPT2预训练从零实现大模型GPT2指令微调通过前面的预训练和指令微调,我们得到了既能续写文本,又能遵守指令的GPT2模型。但从GPT的演进路线来看,要达到ChatGPT的水平,除了增加模型参数、使用更多的数据预训练、更高质量的监督数据指令微调外,还需要一个重要的技术手段,那就是RLHF。(RLHF:ReinforcementLearningfromHumanFeedback):即基于人类.........
www.51cto.com
LLM 评估汇总:真的吊打 LLaMA-3,媲美 GPT-4 吗?_length-controlled alpacaeval: a simple way to debi-CSDN博客
文章浏览阅读1.2k次,点赞26次,收藏15次。一、背景在过去的一年多里,国内在大模型领域的发展异常迅速,涌现出上百个大模型,许多模型已经迭代了多个版本,并且各种指标不断刷新。与此同时,我们也经常在国内的一些文章中看到声称“吊打 LLaMA 3”或“媲美 GPT-4”的说法。那么,国内的大模型真的已经达到对标 OpenAI 的水平了吗?实际上,由于大模型的评估指标种类繁多,各种文章中所对比的模型也不尽相同,甚至有时会出现一些误导信息。因此,我们决定系统性梳理一下公认性能较强的大模型的相关指标,以......
blog.csdn.net
微调神器LLaMA-Factory官方保姆级教程来了,从环境搭建到模型训练评估全覆盖 - 大模型知识库|大模型训练|开箱即用的企业大模型应用平台|智能体开发|53AI
......
www.53ai.com
山东大学项目实训(十六):基于LLaMA-Factory的微调模型评估和测试_使用llamafactory计算bleu指标-CSDN博客
文章浏览阅读752次,点赞6次,收藏9次。通过使用 LLaMA-Factory 对 ChatGLM 进行微调和评估,我们能够有效地监控模型的性能,并通过调整超参数、改进数据集和优化评估策略来不断提升模型质量。微调后的模型在生成准确性、逻辑性和生成效率上都表现出显著的提升,为应用于实际的模拟面试对话系统提供了坚实的基础。_使用llamafactory计算bleu指标......
blog.csdn.net
GitHub - iii-org/akasha
Contribute to iii-org/akasha development by creating an account on GitHub.......
github.com