科学与玄学的争议和哲学中可知论与不可知论有很大的交集,作为哲学思辨的根本话题贯穿古今,即使在科学称为主流的今天也有很多人实际上坚定地主张玄学为本。这两种观念时常可以不精确的映射到理性和感性的思考方式上。
一个玄学派的朋友提了一个非常有意思的问题给我:
你看,世界各地都有独立的关于大洪水的传说,我们现在也一般性的认为人类历史上曾经确有过全球性的大洪水。但世界各地也有独立的神创论,同洪水说一样也是独立而互相印证的,为什么不相信神创论呢?科学是观察世界,总结规律,验证规律;玄学也观察世界,总结规律,互相验证规律。为什么要对玄学有偏见呢?
问题的关键在于“互相”。
一般意义上人总结的规律(注意不是唯物世界观里的客观规律的概念,我们不讨论客观规律是否存在是否可知),是不能跳脱出人的主观性的,因此是描述世界的一种模式和主观观念。按唯物的角度,世界为本,主观规律这种抽象的模式和观念应当越接近事实本身才越有意义,越“客观”。
我们如何检验主观规律和事实的接近程度,或称客观性?科学依靠的是观察,总结,验证这样一套不可置换顺序的流程,他要求观察和验证必须是有先后的,"独立"的,是以区别玄学中观察和验证中对此的不以为意,可以“互相”。
直观的说,这是为了避免主观筛选的样本本身具有过多的相似点而导致对规律的过度拟合———把巧合当成了一般规律。如果我们从普遍流传的神话故事的角度提出洪水说,他就要经过其他所有来源的信息的验证,比如考古学信息、天体物理学信息。如果我们从普遍流传的神话故事的角度提出神创论,那他一样需要其他所有领域的信息来验证。
刻意地缩小观察范围而扩大验证的范围(只根据一部分地区的神话提出神创论而用另一部分地区的理论来验证他,即所谓的“互相”验证)是没有意义的,直观上显然讲这样显然不能防止规律总结过度拟合,事实上他也的确有刻意忽视其他所有领域的信息的嫌疑:考古学的,天体物理学的。此处不展开论证。
当然,持玄学观念者可能既不了解考古学和进化论也不了解天体物理学,从而可能也并不认同。反之,持科学观念者不能忽视任何来源的信息,即使是玄学派的观点他也必须纳入考量(这样高质量的问题,这样的观点碰撞对我是极为有益的,因为在一次充分论证以后就可以一劳永逸的无视,这也是我写作本文的目的),以避免规律总结陷入巧合的过拟合。
以上所有的分析在机器学习理论中对数据集中训练测试集的划分是本质对应的。一个模型的优劣程度依靠测试集来评价,而测试集必须独立于训练集。在训练的过程中划分验证集来有效控制模型的过拟合,这两种看来理所当然的操作手段实际上正体现了科学和玄学的本质区别。