用 NumPy 和基础代数从零构建神经网络(以 MNIST 为例)

引言从零开始实现一个神经网络,是理解深度学习基础的最佳途径之一。本文将仅依赖 NumPy 和基础线性代数,手把手构建一个三层前馈神经网络(输入层 → 隐藏层 → 输出层),并在 MNIST 手写数字数据集上完成训练与评估。 全文分为两大部分: 理论...

理解神经网络的学习

什么是神经网络?当我们谈到“神经网络”时,很多人脑海里会浮现一种“仿生”的感觉——好像机器在模仿人脑思考。没错,人工神经网络 正是受生物神经系统启发的一类机器学习模型。它由无数个简单的计算单元(我们称之为“神经元”)层层连接组成,最终形成一个能够学习...

从零开始推导神经网络

引言:数据无处不在想象一个你熟悉的日常活动,它涉及大量数据:几点做什么,做了多久,做得如何,从1到10给自己打几分。而你的基本信息——身高165cm,体重50kg,年龄18岁——也都是数据的一种形式。 一个有趣的问题浮现:既然所有信息都可以表达为数据...

大模型是否真的在“推理”?一种重新定义逻辑推理的思考

这几年,大语言模型(比如 GPT 系列)的能力持续提升。它们现在不仅能处理复杂的问题,还能生成条理清晰的解释,甚至在逻辑推理任务中的表现,也越来越接近人类。 这个趋势让我开始认真思考一个问题:它们真的在“推理”吗? 按照我们过去的理解,“逻辑推理”是...

英语口语提升很开心

最近有一件让我特别开心的事情。 我的英语口语水平突然有了显著提升。昨天我们组开了一个复盘会议,平时内向腼腆的我,竟然能够用英语在全组面前侃侃而谈,而且还讲得很有结构感。 我的表达套路其实挺清晰的: 先指出“我讲的主题是什么”——这个很重要。 接着讲...

我不想写too personal的文章了

两周没写文章了,感觉隔了很久。 自从上次熬夜写完《如何爱上健身》那篇文章后,我的生活就陷入一种自动循环,很平淡,像机器一般地运行。有些事在推进,有些事停滞。今天复盘了过去几个月的状态,问题不少。 最大的问题是,我忽然意识到:我已经厌倦了写“情绪”与“...

如何让你爱上健身

健身半年以上了,最近成果显著,身材有变化,精神也有变化。是时候写篇文章,复盘一下我是怎么从0开始、摸索、踩坑、最终形成稳定健身习惯的。 去年5月(2024.5),我开始有氧训练——跑步。我很喜欢看 Institute of Human Anato...

你不了解“普通人” —— Richard P. Feynman

加州理工学院Charles C. Lauritsen高能物理实验室1985年10月14日 致 Stephen Wolfram 博士普林斯顿高等研究院自然科学学院 亲爱的Wolfram: 我并不认为当前科学的组织结构会妨碍“复杂性研究”——我...

要解决哪些问题 —— Richard Feynman

一位曾是Tomonaga学生、后来也成为Feynman学生的人写信向他表示祝贺。Feynman回信询问他现在在做什么。对方答复说:“我正在研究相干理论,并将其应用于电磁波在湍流大气中的传播……这是一个朴实而脚踏实地的问题。” 亲爱的Koichi:...

我无法创造的东西,我看不懂

最近写文章,越来越难了。每次想写一个主题,我总觉得素材积累不够;或者,哪怕有了一个思路,头脑里想一遍,假想出来的内容毫无吸引力。 比如今天我想写的主题是:“我无法创造的东西,我就不懂。”这是一个让我很有共鸣的观点,今天正好看到这句话,我非常认同。 我...

所思所想
12317