资料介绍
前OpenAI联合创始人、前特斯拉AI总监、AI大神卡帕西(Andrej Karpathy)近期发布了一段三个半小时的教学视频,深入浅出地讲解了ChatGPT等大语言模型的工作原理。
卡帕西特别强调,这次公开课面向普通大众,没有技术背景也能理解。
其中涵盖模型开发的完整训练过程、如何在实际应用中最有效地使用它们,还有AI未来发展趋势。
卡帕西通过GPT-2、Llama3.1等具体案例,系统介绍了大模型技术,并对新兴的开源模型DeepSeek进行了详细分析。
原视频的中英字幕版本在下面。
评论区