LLM in 2024: 对 LLM 的理论基础和应用方向(辅助编程和搜索)的一些随想

查看 7|回复 0
作者:huangyezhufeng   
TLDR: 更好的阅读体验
  • 个人博客: https://datahonor.com/blog/2024/12/23/ai_think_2024/
  • 公众号: https://mp.weixin.qq.com/s/wOqp6nHBAenK9wP2vIUS9g

    文章导言部分

    我个人对 AI(人工智能)/LLM(Large Language Model, 大语言模型) 是完全祛魅的。即使是在 ChatGPT 问世之后,即使是在 LLM 在各个领域掀起热潮的今天, 我也仍然认为这里并没有什么所谓“智能”的东西——我个人不认为现在的 LLM 会思考,不认为它能真正地创作等等。 我更倾向于将现在的 LLM 看作一个庞大而又精密的机器:庞大到包含几百亿个元件,精密到可以和人类对话并完成各种复杂的任务。 尽管如此,我仍然认为我们正处于一个人工智能的黄金时代,一个 AI 可以大方异彩,可以很大程度上改变我们的未来生活方式的时代!...

    其他
    这篇文章想写很久了,但因为各种原因一直搁置。期间又看了挺多的资料,终于决定现在就动笔写出来。(文章之所以酝酿很久是因为将 LLM 这么复杂的东西简单几百字概括出来并让没有相关背景的人看懂是非常有挑战性的。)
    文章更多地是为了让大家都能了解一下 LLM 背后并没有什么魔法或什么不得了的东西,这个客观的认识是后续讨论的基础。这里关于“收音机”和“庞大而又精密的机器”的比喻相信会对大家有所帮助,其实这个类比的灵感来自Grokking deep learning这本书。虽然这本书质量一般,但是这个类比我一直记了很多年。最后希望文章对大家有帮助,如果文章能帮助到一些人,我个人是很开心的~
  • 您需要登录后才可以回帖 登录 | 立即注册

    返回顶部