首页 > 快讯
微软出招,新模型数学超GPT-4o编程胜Llama3.3,训练新范式引热议:midtraining
【微软出招,新模型数学超GPT-4o编程胜Llama3.3,训练新范式引热议:midtraining】 微软推出最新小模型Phi-4。参数量仅14B,MMLU性能就和Llama 3.3/ Qwen2.5等70B级别大模型坐一桌。数学能力上,Phi-4在美国数学竞赛AMC 10/12上超过了GPT-4o等一众大模型,分数冲上90。编程能力也是开源模型一流,超过了70B的Llama 3.3和72B的Qwen 2.5。微软在技术报告中还提出了一个新的训练范式——midtraining。(量子位)