坐井观天网

探索易于理解并实现的业余手工业创作技能

菜单
61

差异补偿系统

学习的源初引导是差异补偿,可以类比为焦耳-楞次定理。

可以认为学习的源初引导是差异补偿。

但是仅有差异补偿还不足够,为了建立差异与补偿行为的联系,应当具备一套短记忆对应系。

行为的形成需要依靠常在记忆,以匹配已确认的联系。

差异补偿、短记忆对应系和至少可记录一个信息元的常在记忆系是源初学习的三个必要条件。

这个文章只从逻辑模式上讨论,不建议用该系统指导对人类工作原理的理解(尽管你可以这么做),它应该能对对泛模式机器学习系统的设计提供帮助。

例如,婴儿如何学会运动,它如何爬向母亲或者它想去的地方?它有没有“想去”的地方?它的“去”是什么逻辑?他为何(有目的地)运动?

系统首先要能感知变化,以对此做出反应。因此,形象的学习局限在可感知的范围。

确立变化与补偿行为之间联系则涉及反馈,反馈表示行为是否或在何种程度上缩小或增大了感知中的变化。显著幅度动作或手势被视为增大了视觉感受中的变化,可以被判断为拒绝匹配。

对于感受器与执行器不同的普遍情形,该反馈过程的成功工作需要了解各种配合行为的结果感受,例如向前行走导致图像变大等,该关联应当是逐渐建立的,存在于联系匹配库中。

这种结构可以解释从无反馈自主活动到简单目的行为到复杂协调行为的渐进学习过程,无反馈活动阶段主要是建立最基本的联系匹配(进入常在记忆),若某些感受符号匹配到已存在的行为联系,系统则可以试图通过该联系补偿感受变化,此时便进入目的活动阶段。请注意在这里几个阶段是重叠且没有分界线的,因为新关联可以在任何时侯发生。

短记忆对应系用于为变化记录快照(因为反应是延时的),这用于在尝试执行反应时比对感受实时变化与已记录的快照,这可以得出补偿模式有效或无效,趋势参数可以用于连续执行,直到差异平衡到趋势模糊。短记忆对应系可以是阶段简化(抽象)的,这有助于学习复杂行为结构。保持刺激(感受器差别)可以逐渐抹除短记忆快照状态,以替换为新的状态。

联系匹配库可以被关联评价更高的配对更新,这个评价可以是指标的,也可以是快照式的,但后者可能需要专门负责检查的一个独立回环。

狭义语义性质的反馈应该不会包括在这个最基础系统中,尽管这个系统的行为实际可以认为具备一个语义结构,只是这个语义不能解释自身,也不具备指令的概括,因为它的运行模式是其结构通路的本征。

语言和语义的学习需要非常多层的行为抽象。

多层行为抽象的结果是可能形成层次化的快照结构,狭义的语义将以这种层次结构存在于行为匹配库中。

可以为这个系统最简单的形式设计一套人造设备以进行广泛学习。

这个理念还进行了文学化加工,见《秘密》一文。


迁移自旧文章“差异补偿系统”。

评论 (0)

要评论,请发送邮件到xp8110@outlook.com