什么是机器学习中的向量

What is vector in terms of machine learning

我想了解什么是机器学习方面的向量。

我查看了以下 2 个链接:

https://en.wikipedia.org/wiki/Support_vector_machine https://en.wikipedia.org/wiki/Feature_vector.

没看懂。谁能简单解释一下?

我认为你的大部分问题都是因为 向量 是一个有很多用途的通用术语。在这种情况下,可以将其视为值列表或 table 中的一行。数据结构为一维数组; N 个元素的向量是 N 维向量,每个元素一维。

例如,输入 (3.14159, 2.71828, 1.618) 是一个包含 3 个元素的向量,可以表示为三维 space 中的一个点。您的程序将声明一个 1x3 数组(一维数据结构)来保存这三个项目。

这是否有助于您直观地了解基本输入处理?对于 Wronkskian 变换矩阵来说,这不是一个难题 -- 它只是格式和可视化方面的变化。


特征向量只是一行输入。例如,在流行的房价预测机器学习示例中,我们可能具有特征(table 列),包括房屋的建造年份、卧室数量、面积 (m^2) 和车库大小(汽车容量)。这将给出输入向量,例如

[1988, 4, 200, 2]
[2001, 3, 220, 1]

等等

简单来说,
维度:attributes/features 用于分析
例如:
a) 在医疗保健领域:身高、体重、性别、脉率、胆固醇水平
b) 在银行领域:年龄、性别、职业、婚姻状况等

n维向量 :1, e2, e3, ...., en> 其中 ei 是维度 i 的值,元素是有序的。
示例:
<180, 74, M, 60, 120> 是一个 6 维向量,其中 180、74、M、60、120分别是attributes/dimensions身高、体重、性别pulse_rate、cholesterol_level的数值。

<180,74,M,60,120>和<180,M,74,60,120>不是与尺寸重量和性别的顺序相同。

标量值只有大小没有方向。

例如,

  • 学生考试成绩
  • 雇员的工资
  • 城市温度等

矢量值将同时具有大小和方向。

例如,

  • 车辆速度
  • 电流的电流密度
  • 硬币的磁场等

在机器学习中,当我们有多个自变量来预测因变量时,我们通常将所有自变量表示为多维space。

例如,

让我们考虑一个 ML 问题,在这个问题中,我们必须使用以下自变量来预测学生在期末考试中的成绩-

  • 出席率
  • 内试不及格人数
  • 完成的作业数

在这里,我们需要将学生的所有数据点投影到多维 space 中,其中-

维度1-出勤率

维度2 - 内试不及格人数

维度 3 - 完成的任务数

有点像这样-

现在,每个自变量都可以表示为与因变量有关的向量。

喜欢,

“出勤率”向量相对于考试成绩有大小和正向(出勤率增加则期末成绩增加,出勤率下降则期末成绩减少)。

“内试不及格数”向量相对于考试分数有大小和负方向(内试不及格数减少则期末分数增加,分数减少)如果内部考试中失败的科目数量增加)。

现在,如果我们有一个新学生需要预测他的分数,那么我们可以在这 3 个向量中表示他的数据,并且这 3 个向量具有正交关系的点可以被认为是 his/her期末考试预测分数

一维向量中的数据点表示space-

二维向量中的数据点表示space-

3 维向量中的数据点表示space-

希望你有一个想法!!!