浅谈机器学习中的转导

原文： https://machinelearningmastery.com/transduction-in-machine-learning/

转导或转导学习是您在应用机器学习中可能遇到的术语。

该术语与循环神经网络的一些应用一起用于序列预测问题，如自然语言处理领域中的一些问题。

在这篇文章中，您将了解机器学习中的转导。

阅读这篇文章后，你会知道：

转导的定义一般和某些特定的研究领域。
机器学习中的转导学习是什么。
在谈论序列预测问题时，什么转导意味着什么。

让我们开始吧。

概观

本教程分为 4 个部分;他们是：

什么是转导？
转化学习
语言学中的转导
序列预测中的转导

什么是转导？

让我们从一些基本的字典定义开始。

转导手段将某些东西转导成另一种形式。

转导：将（诸如能量或信息之类的东西）转导成另一种形式，基本上感觉器官将物理能量转导成神经信号

Merriam-Webster Dictionary （在线），2017

它是电子和信号处理领域的一个流行术语，其中“_ 传感器 _”是将声音转导为能量或反之亦然的组件或模块的通用名称。

所有信号处理都以输入传感器开始。输入传感器接收输入信号并将其转导为电信号。在信号处理应用中，换能器可以采用多种形式。输入变换器的常见示例是麦克风。

数字信号处理揭秘，1997

在生物学，特别是遗传学中，转导是指将遗传物质转移到另一种微生物的微生物的过程。

转导：转导的作用或过程;特别是：通过病毒剂（如噬菌体）将遗传物质从一种微生物转移到另一种微生物

Merriam-Webster Dictionary （在线），2017

因此，通常，我们可以看到转导是关于将信号转导为另一种形式。

信号处理描述是最突出的，其中声波被转导成电能以供系统内的某些使用。在一些选定的采样水平下，每个声音将由一些电子签名表示。

信号处理传感器示例

转化学习

在统计学习理论领域中使用转导或转导学习来指代给出来自域的特定实例的具体实例。

它与其他类型的学习形成对比，例如归纳学习和演绎学习。

归纳，从给定数据中导出函数。扣除，导出关注点的给定函数的值。转导，从给定数据导出兴趣点的未知函数的值。

第 169 页，统计学习理论的性质，1995

从统计学习理论的本质看诱导，演绎和转导的关系。

这是一个有趣的监督学习框架，其中“_ 近似于数据的映射函数并使用它来做出预测 _”的经典问题被认为比所需要的更困难。相反，直接从域中的实际样本进行特定预测。不需要函数逼近。

估计给定兴趣点处的函数值的模型描述了推理的新概念：从特定到特定的移动。我们将这种类型的推理转导推断称为。请注意，当想要从有限数量的信息中获得最佳结果时，会出现这种推理概念。

第 169 页，统计学习理论的性质，1995

转导算法的经典示例是 K 最近邻算法，其不对训练数据建模，而是在每次需要预测时直接使用它。

转导自然与一组称为基于实例或基于案例的学习的算法相关。也许，这类中最着名的算法是 k-最近邻算法。

通过转导学习，1998 年

语言学中的转导

传统上，在谈论自然语言时，例如在语言学领域，已经使用了转导。

例如，存在“_ 转导语法 _”的概念，其指的是用于将一种语言的示例转导成另一种语言的一组规则。

转导语法描述了结构上相关的一对语言。它生成句子对，而不是句子。语言 1 句子（意图是）语言-2 句子的翻译。

第 460 页，自然语言处理手册，2000。

还有来自计算理论的“有限状态传感器”（FST）的概念，在讨论用于将一组符号映射到另一组符号的翻译任务时调用。重要的是，每个输入产生一个输出。

有限状态传感器由许多状态组成。当在状态之间转导时，消耗输入符号并发出输出符号。

第 294 页，统计机器翻译，2010。

在谈论理论和经典机器翻译时这种转导的使用在谈论现代序列预测与自然语言处理任务中的循环神经网络时使用该术语。

序列预测中的转导

在他的语言处理神经网络教科书中，Yoav Goldberg 将传感器定义为 NLP 任务的特定网络模型。

换能器被狭义地定义为为所提供的每个输入时间步长输出一个时间步长的模型。这映射到语言用法，特别是有限状态传感器。

另一种选择是将 RNN 视为换能器，为其读入的每个输入产生输出。

第 168 页，自然语言处理中的神经网络方法，2017。

他提出了这种类型的序列标记模型以及语言建模。他接着指出，例如使用编解码器架构的条件生成可以被认为是 RNN 换能器的特殊情况。

考虑到编解码器模型架构中的解码器允许给定输入序列的不同数量的输出，在定义中打破“每个输入一个输出”，这最后一点是令人惊讶的。

传感器 RNN 训练图。取自“自然语言处理中的神经网络方法”。

更一般地，转导用于 NLP 序列预测任务，特别是翻译。这些定义似乎比 Goldberg 和 FST 严格的每输入输出更宽松。

例如，Ed Grefenstette，et al。将转导描述为将输入字符串映射到输出字符串。

许多自然语言处理（NLP）任务可以被视为转导问题，即学习将一个字符串转导为另一个字符串。机器翻译是转导的典型示例，最近的结果表明 Deep RNN 能够编码长源字符串并产生连贯的翻译

学习无限记忆的转导，2015。

他们继续提供一些特定的 NLP 任务列表，这些任务有助于使这个广泛的定义具体化。

字符串转导是 NLP 中许多应用的核心，从名称音译和拼写校正到屈折形态和机器翻译

Alex Graves 还使用转导作为转导的同义词，并且有用地还提供了符合定义的示例 NLP 任务列表。

许多机器学习任务可以表示为输入序列到输出序列的转导或转导：语音识别，机器翻译，蛋白质二级结构预测和文本到语音等等。

序列转导与循环神经网络，2012。

总而言之，我们可以重新列出一系列转导自然语言处理任务，如下所示：

音译，以源形式给出示例，以目标形式产生单词。
拼写纠正，在给出错误的单词拼写时生成正确的单词拼写。
屈折形态学，根据源序列和背景产生新的序列。
机器翻译，在源语言中给出示例，以目标语言生成单词序列。
语音识别，产生给定音频序列的文本序列。
蛋白质二级结构预测，预测给定氨基酸输入序列（非 NLP）的 3D 结构。
文本到语音，或语音合成，产生给定文本序列的音频。

最后，除了涉及广泛类别的 NLP 问题和 RNN 序列预测模型的转导概念之外，一些新方法明确地被命名为这样。 Navdeep Jaitly 等人。将他们新的 RNN 序列到序列预测方法称为“_ 神经传感器 _”，技术上用于序列到序列预测的 RNN 也是如此。

我们提出了一种神经传感器，一种更通用的序列到序列学习模型。当输入块到达时，神经传感器可以产生大块的输出（可能是零长度），从而满足“在线”的条件。该模型通过使用实现序列到序列模型的换能器 RNN 为每个块生成输出。

神经传感器，2016

进一步阅读

如果您要深入了解，本节将提供有关该主题的更多资源。

定义

Merriam-Webster 字典定义转导
数字信号处理揭秘，1997
维基百科上遗传学的转录

学习理论

统计学习理论的性质，1995
通过转导学习，1998
维基百科上的转导（机器学习）

语言学

自然语言处理手册，2000。
维基百科上的有限状态传感器
统计机器翻译，2010。

序列预测

自然语言处理中的神经网络方法，2017。
学习无限记忆的转导，2015。
序列转导与循环神经网络，2012。
神经传感器，2016

摘要

在这篇文章中，您发现了应用机器学习中的转导。

具体来说，你学到了：

转导的定义一般和某些特定的研究领域。
机器学习中的转导学习是什么。
在谈论序列预测问题时，什么转导意味着什么。

你有任何问题吗？在下面的评论中提出您的问题，我会尽力回答。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

transduction-in-machine-learning.md

transduction-in-machine-learning.md

浅谈机器学习中的转导

概观

什么是转导？

转化学习

语言学中的转导

序列预测中的转导

进一步阅读

定义

学习理论

语言学

序列预测

摘要

Files

transduction-in-machine-learning.md

Latest commit

History

transduction-in-machine-learning.md

File metadata and controls

浅谈机器学习中的转导

概观

什么是转导？

转化学习

语言学中的转导

序列预测中的转导

进一步阅读

定义

学习理论

语言学

序列预测

摘要