我的Eigen库使用笔记。
Eigen Hello World
-
Eigen是纯头文件库,定义的类、函数、常量等均在
Eigen
命名空间中,为了使表示形式简便,本文默认使用Eigen
命名空间:using namespace Eigen;
- Eigen稠密矩阵和数组模块功能可以查询[QuickRef] Dense matrix and array manipulations;
- Eigen稀疏线性代数模块功能可以查询[QuickRef] Sparse linear algebra;
#include <Eigen/Eigen>
(全部模块功能)=#include <Eigen/Dense>
(绝大部分模块功能)+#include <Eigen/Sparse>
(稀疏矩阵模块功能);#include <Eigen/Core>
为核心模块,包含Matrix
类和Array
类的定义、基础的线性代数操作等;#include <Eigen/Geometry>
为几何模块,包含SLAM相关的位姿表示、四元数、旋转向量等;- 对于MATLAB用户,可以参考Eigen short ASCII reference快速入门,zxl19/Eigen-Cheatsheet将其整理成Markdown和PDF文档;
-
Matrix
模板类定义了矩阵和向量,用于进行线性代数运算,Array
模板类定义了数组,用于进行类似MATLAB的逐元素操作,以Matrix
模板类的原型声明为例对于模板参数进行说明:Matrix<typename Scalar, // [必需] 数据类型 int RowsAtCompileTime, // [必需] 编译时确定的行数,如果不确定可以使用Dynamic指定动态大小 int ColsAtCompileTime, // [必需] 编译时确定的列数,如果不确定可以使用Dynamic指定动态大小 int Options = 0, // [可选] 位字段,可以使用RowMajor指定逐行保存,或者使用ColMajor指定逐列保存,默认逐列保存 int MaxRowsAtCompileTime = RowsAtCompileTime, // [可选] 编译时确定的最大行数,用于避免动态内存分配 int MaxColsAtCompileTime = ColsAtCompileTime> // [可选] 编译时确定的最大列数,用于避免动态内存分配
-
Eigen使用
typedef
关键字重命名了常用大小的矩阵和数组,后缀f
代表float
、d
代表double
、i
代表int
,不同数据类型的矩阵在运算中禁止混用,需要显式类型转换,在使用中应尽可能少用动态大小的矩阵和数组,以提高运行速度:// Matrix类 Matrix<float, Dynamic, Dynamic> <=> MatrixXf Matrix<double, Dynamic, 1> <=> VectorXd Matrix<int, 1, Dynamic> <=> RowVectorXi Matrix<float, 3 , 3> <=> Matrix3f Matrix<float, 4, 1> <=> Vector4f // Array类 Array<float, Dynamic, Dynamic> <=> ArrayXXf Array<double, Dynamic, 1> <=> ArrayXd Array<int, 1, Dynamic> <=> RowArrayXi Array<float, 3, 3> <=> Array33f Array<float, 4, 1> <=> Array4f
-
Matrix
类和Array
类之间运算和类型转换的规则:Array44f a1, a2; Matrix4f m1, m2; m1 = a1 * a2; // 逐元素相乘,运算结果从Array类到Matrix类隐式类型转换 a1 = m1 * m2; // 矩阵相乘,运算结果从Matrix类到Array类隐式类型转换 a2 = a1 + m1.array(); // Array类和Matrix类的对象在运算中禁止混用,需要显式类型转换 m2 = a1.matrix() + m1; // Array类和Matrix类的对象在运算中禁止混用,需要显式类型转换 ArrayWrapper<Matrix4f> m1a(m1); // m1a相当于m1.array(),二者参数相同 MatrixWrapper<Array44f> a1m(a1); // a1m相当于a1.matrix(),二者参数相同
-
Matrix
类和Array
类的初始化方式,建议在定义后对变量进行初始化;-
固定大小——大小确定,可不加行列数:
typedef {Matrix3f | Array33f} FixedXD; FixedXD x; // 创建对应类的对象(作为等号右值) x = FixedXD::Identity(); x = FixedXD::Zero(); x = FixedXD::Ones(); x = FixedXD::Constant(value); x = FixedXD::Random(); x = FixedXD::LinSpaced(size, low, high); // 调用对应成员函数 x.setIdentity(); x.setZero(); x.setOnes(); x.setConstant(value); x.setRandom(); x.setLinSpaced(size, low, high);
-
二维动态大小:
typedef {MatrixXf | ArrayXXf} Dynamic2D; Dynamic2D x; // 创建对应类的对象(作为等号右值) x = Dynamic2D::Identity(rows, cols); x = Dynamic2D::Zero(rows, cols); x = Dynamic2D::Ones(rows, cols); x = Dynamic2D::Constant(rows, cols, value); x = Dynamic2D::Random(rows, cols); // 调用对应成员函数 x.setIdentity(rows, cols); x.setZero(rows, cols); x.setOnes(rows, cols); x.setConstant(rows, cols, value); x.setRandom(rows, cols);
-
一维动态大小:
typedef {VectorXf | ArrayXf} Dynamic1D; Dynamic1D x; // 创建对应类的对象(作为等号右值) x = Dynamic1D::Zero(size); x = Dynamic1D::Ones(size); x = Dynamic1D::Constant(size, value); x = Dynamic1D::Random(size); x = Dynamic1D::LinSpaced(size, low, high); // 调用对应成员函数 x.setZero(size); x.setOnes(size); x.setConstant(size, value); x.setRandom(size); x.setLinSpaced(size, low, high);
-
Matrix
类
矩阵初始化
初始化为特殊矩阵
// 基向量
x = Vector3f::UnitX(); // 1 0 0
x = Vector3f::UnitY(); // 0 1 0
x = Vector3f::UnitZ(); // 0 0 1
x = Vector4f::Unit(i);
x.setUnit(i);
x = VectorXf::Unit(size, i);
x.setUnit(size, i);
逐元素初始化
可以使用<<
运算符逐行对于元素进行初始化,也可以使用下标对于特定元素进行初始化:
// 二维固定大小
Matrix2d A;
A << 1.0, 0.0,
0.0, 1.0;
A(0, 0) = 1.0;
A(0, 1) = 0.0;
A(1, 0) = 0.0;
A(1, 1) = 1.0;
// 二维动态大小
int rows = 5, cols = 5;
MatrixXf m(rows, cols);
// .finished()成员函数返回初始化后的临时变量
m << (Matrix3f() << 1, 2, 3, 4, 5, 6, 7, 8, 9).finished(),
MatrixXf::Zero(3, cols - 3),
MatrixXf::Zero(rows - 3, 3),
MatrixXf::Identity(rows - 3, cols - 3);
// 一维固定大小
Vector4d b(0, 1, 2, 3);
b << 0, 1, 2, 3;
b(0) = 0;
b(1) = 1;
b(2) = 2;
b(3) = 3;
// 仅适用于向量
b[0] = 0;
b[1] = 1;
b[2] = 2;
b[3] = 3;
// 仅适用于向量的前四个元素
b.x() = 0;
b.y() = 1;
b.z() = 2;
b.w() = 3;
从内存中映射
float array[3];
// 映射,array内容随着矩阵内容变化
Vector3f::Map(array).fill(10);
int data[4] = {1, 2, 3, 4};
// 初始化,data内容被复制到矩阵中
Matrix2i mat2x2(data);
// 映射,data内容随着矩阵内容变化
Matrix2i::Map(data) = 2 * mat2x2;
MatrixXi::Map(data, 2, 2) += mat2x2;
矩阵操作
计算大小
// 向量长度
x.size()
// 矩阵行数、列数
C.rows()
C.cols()
转置
// 以矩阵为例,向量同理
// 转置
C.transpose()
C.transposeInPlace() // in-place version
// 共轭转置
C.adjoint()
C.adjointInPlace() // in-place version
在使用矩阵的转置给自身赋值时需要避免混淆问题,混淆问题的产生原因和应对方法将在后文中详述:
// 错误,存在混淆问题
C = C.transpose();
C = C.adjoint();
// 正确,避免混淆问题
C = C.transposeInPlace();
C = C.adjointInPlace();
求和
// 以矩阵为例,向量同理
C.sum()
取模
x.norm() // 取模
x.squaredNorm() // 模的平方
范数
// 以矩阵为例,向量同理
C.lpNorm<1>() // 1-范数
C.lpNorm<2>() // 2-范数
C.lpNorm<Infinity>() // 无穷范数
类型转换
// 以矩阵为例,向量同理
C.cast<double>() // 转为double类型
C.cast<float>() // 转为float类型
C.cast<int>() // 转为int类型
C.real() // 逐元素取实部
C.imag() // 逐元素取虚部
C.conjugate() // 逐元素取共轭
改变大小
// 大小改变后删除原有数据,大小不变时无操作
// 向量
vector.resize(size);
// 矩阵
matrix.resize(nb_rows, nb_cols);
matrix.resize(NoChange, nb_cols);
matrix.resize(nb_rows, NoChange);
// 大小改变后保留原有数据
// 向量
vector.resizeLike(other_vector);
vector.conservativeResize(size);
// 矩阵
matrix.resizeLike(other_matrix);
matrix.conservativeResize(nb_rows, nb_cols);
获取运行时信息
// 返回指向第一个元素的指针
// 向量
x.data()
// 矩阵
C.data()
// 返回内部步长(inner stride),即相邻元素之间的内存地址增量
// 向量
x.innerStride()
// 矩阵
C.innerStride()
// 返回外部步长(outer stride),即相邻行或列之间的内存地址增量,取决于矩阵是逐行保存还是逐列保存
// 矩阵
C.outerStride()
分块
// 向量
// Eigen // MATLAB
x.head(n) // x(1:n)
x.head<n>() // x(1:n)
x.tail(n) // x(end - n + 1: end)
x.tail<n>() // x(end - n + 1: end)
x.segment(i, n) // x(i+1 : i+n)
x.segment<n>(i) // x(i+1 : i+n)
// 矩阵
// Eigen // MATLAB
P.block(i, j, rows, cols) // P(i+1 : i+rows, j+1 : j+cols)
P.block<rows, cols>(i, j) // P(i+1 : i+rows, j+1 : j+cols)
P.row(i) // P(i+1, :)
P.col(j) // P(:, j+1)
P.leftCols<cols>() // P(:, 1:cols)
P.leftCols(cols) // P(:, 1:cols)
P.middleCols<cols>(j) // P(:, j+1:j+cols)
P.middleCols(j, cols) // P(:, j+1:j+cols)
P.rightCols<cols>() // P(:, end-cols+1:end)
P.rightCols(cols) // P(:, end-cols+1:end)
P.topRows<rows>() // P(1:rows, :)
P.topRows(rows) // P(1:rows, :)
P.middleRows<rows>(i) // P(i+1:i+rows, :)
P.middleRows(i, rows) // P(i+1:i+rows, :)
P.bottomRows<rows>() // P(end-rows+1:end, :)
P.bottomRows(rows) // P(end-rows+1:end, :)
P.topLeftCorner(rows, cols) // P(1:rows, 1:cols)
P.topRightCorner(rows, cols) // P(1:rows, end-cols+1:end)
P.bottomLeftCorner(rows, cols) // P(end-rows+1:end, 1:cols)
P.bottomRightCorner(rows, cols) // P(end-rows+1:end, end-cols+1:end)
P.topLeftCorner<rows,cols>() // P(1:rows, 1:cols)
P.topRightCorner<rows,cols>() // P(1:rows, end-cols+1:end)
P.bottomLeftCorner<rows,cols>() // P(end-rows+1:end, 1:cols)
P.bottomRightCorner<rows,cols>() // P(end-rows+1:end, end-cols+1:end)
矩阵运算
方阵相关
C.trace() // 迹
C.inverse() // 逆
C.determinant() // 行列式
点乘和叉乘
// 点乘
x.dot(y)
x.transpose() * y
// 叉乘
x.cross(y)
逐元素运算
-
Matrix
类可以通过调用对应成员函数实现逐元素运算,此时返回值类型为Matrix
类:mat1.cwiseMin(mat2) mat1.cwiseMin(scalar) mat1.cwiseMax(mat2) mat1.cwiseMax(scalar) mat1.cwiseAbs2() mat1.cwiseAbs() mat1.cwiseSqrt() mat1.cwiseInverse() mat1.cwiseProduct(mat2) mat1.cwiseQuotient(mat2) mat1.cwiseEqual(mat2) mat1.cwiseEqual(scalar) mat1.cwiseNotEqual(mat2)
-
也可以将
Matrix
类转换为Array
类后调用对应成员函数实现逐元素运算,此时返回值类型为Array
类:mat1.array().min(mat2.array()) mat1.array().min(scalar) mat1.array().max(mat2.array()) mat1.array().max(scalar) mat1.array().abs2() mat1.array().abs() mat1.array().sqrt() mat1.array().inverse() mat1.array() * mat2.array() mat1.array() / mat2.array() mat1.array() == mat2.array() mat1.array() == scalar mat1.array() != mat2.array()
求解Ax=b形式线性方程组
Eigen提供的全部稠密矩阵分解方法及其特性和数值稳定性可以参考Catalogue of dense decompositions。
有解析解
x = A.inverse() * b; // 直接求逆,速度最慢
x = A.partialPivLu().solve(b); // 部分主元LU分解,要求可逆阵
x = A.colPivHouseholderQr().solve(b); // 列主元QR分解
x = A.llt().solve(b); // Cholesky分解,要求正定阵
x = A.ldlt().solve(b); // LDLT分解,要求正定阵或非负定阵
- Eigen提供的全部求解方法及其对于矩阵要求、求解速度、求解精度的对比可以参考Linear algebra and decompositions;
- Eigen提供的全部求解方法及其在不同大小矩阵下求解速度的定量对比可以参考Benchmark of dense decompositions;
无解析解
求解最小二乘问题:
- Eigen提供的三种求解方法可以参考Solving linear least squares systems;
-
三种求解方法及其求解速度和求解精度的对比:
求解方法 求解速度 求解精度 SVD分解 低 高 列主元QR分解 中 中 求解正规方程 高 低
x = A.bdcSvd(ComputeThinU | ComputeThinV).solve(b); // SVD分解
x = A.colPivHouseholderQr().solve(b); // 列主元QR分解
x = (A.transpose() * A).ldlt().solve(A.transpose() * b); // 求解正规方程
relative_error = (A * x - b).norm() / b.norm(); // L2范数相对误差
特征值计算
Matrix3f A;
// 初始化方式1
EigenSolver<Matrix3f> eigen_solver(A);
// 初始化方式2,可用于计算多个矩阵的特征值
EigenSolver<Matrix3f> eigen_solver;
eigen_solver.compute(A);
if (eigen_solver.info() == Success) {
// 计算成功
Vector3f eigen_value = eigen_solver.eigenvalues(); // 特征值
Matrix3f eigen_vector = eigen_solver.eigenvectors(); // 特征向量
} else if (eigen_solver.info() == NoConvergence) {
// 计算失败
std::cout << "Computation Failed!" << std::endl;
}
// 实对称矩阵可以保证对角化成功,初始化方式和查看计算结果方式与上面相同
SelfAdjointEigenSolver<Matrix3f> eigen_solver(A.transpose() * A);
奇异值分解
// 方阵
Matrix3f A;
// A = USV*
// 参数ComputeFullU和ComputeFullV分别表示计算方阵U和方阵V
// 此时奇异值矩阵S为方阵
JacobiSVD<Matrix3f> svd(A, ComputeFullU | ComputeFullV);
Matrix3f U = svd.matrixU();
Matrix3f V = svd.matrixV();
Vector3f sv = svd.singularValues();
// 非方阵
MatrixXf A;
// A = USV*
// 参数ComputeFullU和ComputeFullV分别表示计算方阵U和方阵V
// 此时奇异值矩阵S为非方阵
JacobiSVD<MatrixXf> svd(A, ComputeFullU | ComputeFullV);
// 参数ComputeThinU和ComputeThinV分别表示计算非方阵U和非方阵V
// 此时奇异值矩阵S为方阵
JacobiSVD<MatrixXf> svd(A, ComputeThinU | ComputeThinV);
MatrixXf U = svd.matrixU();
MatrixXf V = svd.matrixV();
VectorXf sv = svd.singularValues();
Array
类
逐元素运算
包括算术运算符、比较运算符、常用数学函数等:
array1.abs2()
array1.abs() abs(array1)
array1.sqrt() sqrt(array1)
array1.log() log(array1)
array1.log10() log10(array1)
array1.exp() exp(array1)
array1.pow(array2) pow(array1,array2)
array1.pow(scalar) pow(array1,scalar)
pow(scalar,array2)
array1.square()
array1.cube()
array1.inverse()
array1.sin() sin(array1)
array1.cos() cos(array1)
array1.tan() tan(array1)
array1.asin() asin(array1)
array1.acos() acos(array1)
array1.atan() atan(array1)
array1.sinh() sinh(array1)
array1.cosh() cosh(array1)
array1.tanh() tanh(array1)
array1.arg() arg(array1)
array1.floor() floor(array1)
array1.ceil() ceil(array1)
array1.round() round(aray1)
array1.isFinite() isfinite(array1)
array1.isInf() isinf(array1)
array1.isNaN() isnan(array1)
位姿表示
旋转向量、四元数表示的位姿可以直接当做旋转矩阵参与运算,因为重载了乘法运算符。
不同表示方式的位姿在赋值时需要进行显式类型转换。
位姿初始化
旋转向量
旋转向量并不是为了储存旋转,而是为了更加方便地创建其他类型的旋转。
旋转轴必须是单位向量,推荐使用基向量。
示例:
// 3D旋转矩阵直接使用Matrix3d或Matrix3f
Matrix3d rotation_matrix = Matrix3d::Identity();
// 旋转向量使用AngleAxis,其底层不直接是Matrix类,但运算可以当作矩阵(因为重载了运算符)
AngleAxisd rotation_vector(M_PI / 4, Vector3d(0, 0, 1)); // 沿Z轴旋转45度
rotation_matrix = rotation_vector.matrix(); // 旋转向量转旋转矩阵
rotation_matrix = rotation_vector.toRotationMatrix(); // 旋转向量转旋转矩阵
// 用AngleAxis进行坐标变换
Vector3d v(1, 0, 0);
Vector3d v_rotated = rotation_vector * v;
// 相当于用旋转矩阵进行坐标变换
Vector3d v_rotated = rotation_matrix * v;
欧拉角
在使用欧拉角表示旋转时,存在内旋(intrinsic rotation)和外旋(extrinsic rotation)的区别:
- 内旋也被称为旋转轴(rotated axis),此时每个欧拉角表示相对于上一次旋转后的坐标轴的旋转,在按照旋转顺序相乘时需要右乘,Eigen中采用了这样的表示方式;
- 外旋也被称为固定轴(fixed axis),此时每个欧拉角表示相对于固定坐标轴的旋转,在按照旋转顺序相乘时需要左乘,组合导航领域中采用了这样的表示方式;
- 每种特定顺序的外旋等价于相反顺序的内旋;
示例:
// 旋转矩阵转欧拉角,单位为弧度
// 输入参数为指定的旋转顺序,0、1、2分别代表x轴、y轴、z轴
// 输出参数为指定旋转顺序的欧拉角,范围分别为[0, pi]、[-pi, pi]、[-pi, pi]
Vector3d euler_angles = rotation_matrix.eulerAngles(2, 1, 0); // 旋转顺序为ZYX,即yaw-pitch-roll
// 下标顺序对应指定旋转顺序中的欧拉角顺序
double yaw_rad = euler_angle[0];
double pitch_rad = euler_angle[1];
double roll_rad = euler_angle[2];
// 欧拉角转旋转矩阵,借助旋转向量,单位为弧度
AngleAxisd yaw_vector(yaw_rad, Vector3d::UnitZ());
AngleAxisd pitch_vector(pitch_rad, Vector3d::UnitY());
AngleAxisd roll_vector(roll_rad, Vector3d::UnitX());
// 内旋在按照旋转顺序相乘时需要右乘
Matrix3d rotation_matrix = (yaw_vector * pitch_vector * roll_vector).toRotationMatrix();
四元数
必须使用单位四元数表示旋转。
示例:
// 直接初始化,注意参数顺序为(w,x,y,z)
Quaterniond q = Quaterniond(q_w, q_x, q_y, q_z);
// 可以把AngleAxis赋值给四元数,反之亦然
Quaterniond q = Quaterniond(rotation_vector);
// 可以把旋转矩阵赋值给四元数
Quaterniond q = Quaterniond(rotation_matrix);
// 向量v1和向量v2之间的旋转,将向量v1旋转到与向量v2同向,对于两个向量的模长没有要求
Quaterniond q = Quaterniond::FromTwoVectors(v1, v2);
// 访问四元数中各元素
q.x()
q.y()
q.z()
q.w()
q.coeffs() // 注意coeffs的顺序是(x, y, z, w),w为实部,前三者为虚部,这也是Eigen中四元数的存储顺序
q.normalize() // 归一化四元数,直接对原四元数操作,无返回值,不能作为等号右值
q.normalized() // 归一化四元数,原四元数不变,返回拷贝构造值,可以作为等号右值
q.matrix() // 四元数转旋转矩阵
q.toRotationMatrix() // 四元数转旋转矩阵
// 取共轭和取逆仅在单位四元数情况下是等价的,相当于对旋转取逆
q.conjugate() // 取共轭,q * q^{*} = \|q\|^{2}
q.inverse() // 取逆,q * q^{-1} = 1
// 使用四元数旋转一个向量,使用重载的乘法即可
v_rotated = q * v; // 注意数学上是qvq^{-1}
欧氏变换
示例:
// 欧氏变换矩阵使用Isometry
Isometry3d T = Isometry3d::Identity(); // 虽然称为3d,实质上是4*4的矩阵
T.rotate(rotation_vector); // 按照rotation_vector进行旋转
T.pretranslate(Vector3d(1, 2, 3)) // 把平移向量设成(1, 2, 3)
T.matrix() // 欧氏变换矩阵
// 用欧氏变换矩阵进行坐标变换
Vector3d v_transformed = T * v; // 相当于R * v + t
位姿相关运算
旋转矩阵归一化
-
四元数法:
通过将旋转矩阵转换为四元数,将四元数归一化后再转回旋转矩阵。
Matrix3f R; Quaternionf q(R); R = q.normalized().toRotationMatrix();
-
SVD分解法:
Matrix3f R; JacobiSVD<MatrixXf> svd(R, ComputeFullU | ComputeFullV); R = svd.matrixU() * svd.matrixV().transpose();
-
流形投影法:
Matrix3f R; Matrix3f H = R * R.transpose(); Matrix3f L = H.llt().matrixL(); R = L.inverse() * R;
位姿插值
double t1, t2, t;
Quaterniond quat1, quat2, quat;
Vector3d trans1, trans2, trans;
assert(t1 <= t && t <= t2);
// 当t1和t2过于接近时,选择与当前时刻最近的位姿作为插值结果即可
if (t2 - t1 <= std::numeric_limits<double>::epsilon()) {
quat = ((t1 + t2) > 2 * t) ? quat1 : quat2;
trans = ((t1 + t2) > 2 * t) ? trans1 : trans2;
}
// 这里可以看出当t1和t2过于接近时会引起数值误差
double ratio = (t - t1) / (t2 - t1);
// 旋转部分位姿使用球面线性插值(Spherical Linear Interpolation,SLERP)
Quaterniond quat = quat1.slerp(ratio, quat2);
// 平移部分位姿使用线性插值
Vector3d trans = trans1 + ratio * (trans2 - trans1);
常见问题
C++中的template
和typename
关键字
-
从C++的角度,
template
和typename
关键字有两种用途:-
定义模板:
template <typename T> // 此处使用typename或class均可 bool isPositive(T x) { return x > 0; }
-
显式指定表达式为模板名(
template
)或类型名(typename
),否则编译器在进行语法检查时会将模板名当做成员变量,将模板参数分隔符<
当做小于号处理,导致编译失败;
-
-
MatrixBase
类中的block()
、cast()
、corner()
、end()
、lpNorm()
、part()
、segment()
、start()
成员函数都是模板函数,在模板中使用这些成员函数时,需要使用template
关键字显式指定:template <typename T> void transform(Matrix<T, 3, 4> & m, const Matrix<T, 3, 3> trans, const Quaternion<T> qrot) { // 方法一 m.template block<3, 3>(0, 0) = qrot.toRotationMatrix().transpose(); m.template block<3, 1>(0, 3) = -m.template block<3, 3>(0, 0) * trans; // 方法二 m.template corner<3, 3>(TopLeft) = qrot.toRotationMatrix().transpose(); m.col(3) = -m.template corner<3, 3>(TopLeft) * trans; // col()、row()成员函数不是模板函数 }
-
使用时的注意事项如下:
- 从属名(dependent name)指的是直接或间接依赖模板参数的变量名;
-
当代码中存在
xxx.yyy
或xxx->yyy
形式,且xxx
为从属名,yyy
为模板名时,应在模板名前使用template
关键字显式指定:// 错误 xxx.yyy; xxx->yyy; // 正确 xxx.template yyy; xxx->template yyy;
-
当代码中存在
xxx::yyy
形式,且xxx
为从属名,yyy
为类型名时,应在表达式整体前使用typename
关键字显式指定:// 错误 xxx::yyy; // 正确 typename xxx::yyy;
Eigen中的混淆问题
-
混淆问题(aliasing)指的是在赋值表达式中
Matrix
类或Array
类的同一个对象同时出现在赋值运算符两侧的情况,部分情况下影响计算结果的正确性:MatrixXi mat(3, 3); mat << 1, 2, 3, 4, 5, 6, 7, 8, 9; // 不影响计算结果的正确性 mat = 2 * mat; // 影响计算结果的正确性 mat = mat.transpose(); mat.bottomRightCorner(2, 2) = mat.topLeftCorner(2, 2); vec = vec.head(n);
- Eigen默认使用运行时断言(run-time assertion)检测混淆问题,运行时断言可以通过在编译时定义
EIGEN_NO_DEBUG
宏进行关闭; -
可以通过以下两种方法解决混淆问题:
-
使用
eval()
成员函数将等号右值保存为临时变量,在赋值时进行拷贝构造:mat = mat.transpose().eval(); mat.bottomRightCorner(2, 2) = mat.topLeftCorner(2, 2).eval();
-
使用为应对混淆问题特殊定义的成员函数:
// 相比于使用eval()成员函数速度更快 mat = mat.transposeInPlace(); mat = mat.adjointInPlace(); mat = mat.reverseInPlace(); // 对于缩小大小引起的混淆问题,使用conservativeResize()成员函数 vec.conservativeResize(n);
-
Eigen中的内存对齐问题
内存对齐与向量化运算
- 内存对齐是向量化运算(vectorization)的前提;
- 向量化运算指的是使用单指令多数据流(Single Instruction Multiple Data,SIMD)指令集,实现一条指令对多个操作数的运算,进而实现运算加速;
- 常用的SIMD指令集包括SSE(Streaming SIMD Extensions)、AVX( Advanced Vector Extensions)等,其中SSE的操作数要求16字节对齐,AVX的操作数要求32字节对齐;
固定大小可向量化的Eigen对象
-
Eigen将编译时大小固定,并且大小是16字节的整数倍的对象称为固定大小可向量化的(fixed-size vectorizable),主要包括:
Vector2d Vector4d Vector4f Matrix2d Matrix2f Matrix4d Matrix4f Affine3d Affine3f Quaterniond Quaternionf
-
目前向量化运算支持128位数据包(例如SSE、AltiVec)、256位数据包(例如AVX)、512位数据包(例如AVX512),分别对应16字节、32字节、64字节,对于这些大小的数据包读写效率最高,因此对于固定大小可向量化的Eigen对象进行内存对齐有利于提高运算效率;
包含Eigen对象的类和结构体
-
对于包含固定大小可向量化的Eigen对象的类和结构体,如果需要使用
new
运算符进行动态内存分配,则需要将宏EIGEN_MAKE_ALIGNED_OPERATOR_NEW
声明为类和结构体的公有成员,这样在动态内存分配时会自动进行内存对齐:class Foo { private: Vector4d v; public: EIGEN_MAKE_ALIGNED_OPERATOR_NEW }; Foo* foo = new Foo;
- 如果使用C++17标准进行编译则不需要上述操作,因为C++17标准有对于超出默认对齐尺寸(over-aligned)数据的动态内存分配机制;
- 在C++17标准下,宏
EIGEN_MAKE_ALIGNED_OPERATOR_NEW
定义为空; - 尽量将类和结构体中的Eigen对象声明一起放在类和结构体的开头,这并不是Eigen内存对齐的强制要求,但是可以节省内存对齐的空间;
- 动态大小的Eigen对象自动进行动态内存分配,自动进行内存对齐,不需要上述操作;
-
如果需要根据模板参数进行条件判断是否使用内存对齐,则需要使用宏
EIGEN_MAKE_ALIGNED_OPERATOR_NEW_IF
进行判断:template<int n> class Foo { typedef Matrix<float, n, 1> Vector; enum { NeedsToAlign = (sizeof(Vector) % 16) == 0 }; Vector v; public: EIGEN_MAKE_ALIGNED_OPERATOR_NEW_IF(NeedsToAlign) }; Foo<4> *foo4 = new Foo<4>; // foo4 is guaranteed to be 128bit-aligned Foo<3> *foo3 = new Foo<3>; // foo3 has only the system default alignment guarantee
- 在参数
NeedsToAlign
为真时,自动添加宏EIGEN_MAKE_ALIGNED_OPERATOR_NEW
进行内存对齐; - 如果使用C++17标准进行编译则不需要上述操作,因为C++17标准有对于超出默认对齐尺寸数据的动态内存分配机制;
- 在C++17标准下,宏
EIGEN_MAKE_ALIGNED_OPERATOR_NEW_IF
定义为空;
- 在参数
-
如果不想在多处声明宏
EIGEN_MAKE_ALIGNED_OPERATOR_NEW
,可以通过以下两种方法:-
使用
DontAlign
关闭内存对齐,但是这会带来加载和存储上的额外耗时,具体影响程度主要取决于硬件:class Foo { private: Matrix<double, 4, 1, DontAlign> v; }
-
将固定大小可向量化的Eigen对象指针声明为类和结构体的私有成员,在创建类和结构体的对象时动态分配内存,优点是类和结构体不受到内存对齐的影响,缺点是需要额外的堆(heap)分配:
struct Foo_d { EIGEN_MAKE_ALIGNED_OPERATOR_NEW Vector4d v; }; struct Foo { Foo() { init_d(); } ~Foo() { delete d; } void bar() { // use d->v instead of v } private: void init_d() { d = new Foo_d; } Foo_d* d; };
-
-
如果需要声明指定数据结构内存对齐,则需要使用宏
EIGEN_ALIGN_TO_BOUNDARY
:-
Eigen对于常用的8字节、16字节、32字节、64字节内存对齐定义了别名:
// Shortcuts to EIGEN_ALIGN_TO_BOUNDARY #define EIGEN_ALIGN8 EIGEN_ALIGN_TO_BOUNDARY(8) #define EIGEN_ALIGN16 EIGEN_ALIGN_TO_BOUNDARY(16) #define EIGEN_ALIGN32 EIGEN_ALIGN_TO_BOUNDARY(32) #define EIGEN_ALIGN64 EIGEN_ALIGN_TO_BOUNDARY(64)
-
宏
EIGEN_ALIGN_TO_BOUNDARY
仅用于声明需要内存对齐,无法保证在动态内存分配中内存对齐,需要结合宏EIGEN_MAKE_ALIGNED_OPERATOR_NEW
使用:struct EIGEN_ALIGN16 Point { PCL_ADD_POINT4D; float intensity; float time; std::uint16_t ring; EIGEN_MAKE_ALIGNED_OPERATOR_NEW } /*EIGEN_ALIGN16*/; // 放在这里也可
-
包含Eigen对象的STL容器
-
对于包含固定大小可向量化的Eigen对象的STL容器,需要使用Eigen定义的超出默认对齐尺寸的堆内存管理器(over-aligned allocator)
aligned_allocator
进行内存对齐:std::map<int, Vector4d, std::less<int>, aligned_allocator<std::pair<const int, Vector4d> > >
std::less
是std::map
默认的排序函数,但是在这里为了指定堆内存管理器类型需要在其之前指定;- 如果使用C++17标准进行编译则不需要上述操作,因为C++17标准有对于超出默认对齐尺寸数据的动态内存分配机制;
-
如果需要使用
std::vector
,除了需要使用Eigen定义的堆内存管理器aligned_allocator
,还需要包含头文件#include <Eigen/StdVector>
进行内存对齐:#include <Eigen/StdVector> std::vector<Vector4f, aligned_allocator<Vector4f> >
- C++11之前的标准在调用
std::vector
的resize()
成员函数时会调用元素的默认构造函数,造成元素的值传递,会破坏内存对齐; - 如果使用C++11以后的标准进行编译则不需要上述操作,因为C++11标准修复了之前标准中
std::vector
存在的问题;
- C++11之前的标准在调用
-
如果需要根据模板参数进行条件判断
std::vector
是否使用内存对齐,则需要使用宏EIGEN_DEFINE_STL_VECTOR_SPECIALIZATION
进行判断:#include<Eigen/StdVector> EIGEN_DEFINE_STL_VECTOR_SPECIALIZATION(Matrix2d) std::vector<Vector2d>
- 如果使用C++11以后的标准进行编译则不需要上述操作,因为C++11标准修复了之前标准中
std::vector
存在的问题; - 优点是不需要在多处指定Eigen定义的堆内存管理器
aligned_allocator
,缺点是需要在每次声明std::vector
前声明宏EIGEN_DEFINE_STL_VECTOR_SPECIALIZATION
,否则会使用默认堆内存管理器std::allocator
造成程序崩溃;
- 如果使用C++11以后的标准进行编译则不需要上述操作,因为C++11标准修复了之前标准中
-
如果需要使用
emplace()
或emplace_back()
函数向STL容器中添加Eigen对象,不能传入初始化列表,存在内存对齐问题:-
在构造时调用了
std::allocator_traits
的construct()
成员函数,原型声明如下:template <class T, class... Args> static void construct(allocator_type alloc, T* p, Args&&... args);
-
实现:
// 优先调用堆内存管理器的construct()成员函数 alloc.construct(p, forward<Args>(args)...); // 如果堆内存管理器未定义construct()成员函数,则使用默认的new运算符 // Eigen定义的堆内存管理器就是这种情况 ::new(static_cast<void*>(p)) T(forward<Args>(args)...);
-
将Eigen对象作为函数参数传递
- 从C++的角度,不建议使用值传递,因为会调用拷贝构造函数,对于大对象较为耗时,建议使用引用传递,如果不需要修改函数参数,建议使用常引用传递;
-
从Eigen的角度,在将固定大小可向量化的Eigen对象作为函数参数传递时,不能使用值传递,应当使用引用传递,如果不需要修改函数参数,建议使用常引用传递;
void my_function(Vector2d v); // 错误 void my_function(const Vector2d& v); // 正确
struct Foo { Vector2d v; }; void my_function(Foo v); // 错误 void my_function(const Foo& v); // 正确
- 原因是在值传递的过程中不考虑Eigen对象的内存对齐修饰符(alignment modifier);
- Eigen对象作为函数返回值不受影响;
创建指向Eigen对象的智能指针
- 在创建指向Eigen对象的智能指针时,不能使用
std::make_shared()
,因为其使用的是默认的new
运算符,忽略了重载后的new
运算符,存在内存对齐问题; -
可以通过以下两种方法创建指向Eigen对象的智能指针:
-
使用重载后的
new
运算符,显式调用智能指针构造函数:std::shared_ptr<A> spA = std::shared_ptr<A>(new A(args));
-
使用Eigen定义的堆内存管理器
aligned_allocator
以及std::allocate_shared()
:std::shared_ptr<A> spA = std::allocate_shared<A>(aligned_allocator<A>(), args);
-
C++11中的auto
关键字
不建议在Eigen表达式中使用auto
关键字,特别是不要使用auto
关键字代替Matrix
类,部分情况下存在未定义行为:
-
可能导致表达式被重复计算;
示例:
MatrixXd A, B; auto C = A * B; // 返回抽象表达式,表示矩阵乘积并保存到A和B的引用 for (...) { w = C * v; // 每次循环都会重复计算A * B }
-
可能导致表达式的值发生变化;
示例:
MatrixXd A, B; auto C = A * B; // 返回抽象表达式,表示矩阵乘积并保存对A和B的引用 MatrixXd R1 = C; // do something with A MatrixXd R2 = C; // A的值发生了变化,导致表达式的值发生了变化,R1≠R2
-
可能导致程序崩溃;
-
示例一:
// eval()成员函数返回表达式的计算结果,是一个临时对象 // transpose()成员函数返回对这个临时对象的引用 // 执行后表达式C是一个对已被析构的临时对象的引用 auto C = ((A + B).eval()).transpose(); // 再使用表达式C会导致程度崩溃 // do something with C
-
示例二:
VectorXd u, v; // normalized()成员函数会隐式调用eval()成员函数 auto C = u + (A * v).normalized(); // do something with C
-
- 上述问题产生的根本原因是Eigen使用了惰性求值策略,将在后文中详述;
- 解决方案是对于表达式整体调用
eval()
成员函数,返回确定类型的表达式的值;
Eigen中的惰性求值问题
- 惰性求值(lazy evaluation)指的是在需要使用表达式的值的时候再计算表达式的值,是一种求值策略,与之相对的是及早求值(eager evaluation);
- 基于表达式模板(expression-template-based)的库可以使用惰性求值策略,从而避免将子表达式求值为临时变量,在大多数情况下可以极大提高运行速度;
- Eigen中的所有表达式都是惰性求值的,对于表达式整体的求值仅发生在将表达式赋值给变量时,在此之前仅构建抽象表达式树(abstract expression tree),其目的是尽可能避免临时变量在计算和拷贝过程中重复遍历内存空间;
-
Eigen具有智能编译时(compile-time)机制,会将部分子表达式提前求值为临时变量:
-
主要是考虑到以下两种原因:
- 纯惰性求值在部分情况下影响计算性能;
- 纯惰性求值在部分情况下影响计算结果的正确性;
-
具体包括以下三种情况:
-
具有赋值表达式
a = b
的形式,其中表达式b
具有赋值前求值标志(evaluate-before-assigning flag),例如矩阵乘法:// 此时惰性求值影响计算结果的正确性 mat = mat * mat; // (mat * mat)被求值为临时变量 // 此时惰性求值不影响计算结果的正确性 // noalias()成员函数可以屏蔽赋值前求值标志,强制惰性求值 mat1.noalias() = mat2 * mat2;
-
具有嵌套表达式
a + b
的形式,其中表达式b
具有嵌套前求值标志(evaluate-before-nesting flag),例如矩阵乘法:mat1 = mat2 * mat3 + mat4 * mat5; // (mat2 * mat3)、(mat4 * mat5)被求值为临时变量
-
成本模型显示将子表达式求值为临时变量后操作的总成本降低,例如计算成本较高并且被多次重复使用的中间结果:
mat1 = mat2 * (mat3 + mat4); // (mat3 + mat4)被求值为临时变量
-
-
-
Eigen提供了成员函数用于手动覆盖默认行为:
// 用于等号右值,立即计算表达式的值 // 对于非表达式的Matrix类对象返回常引用,避免无用拷贝 // 应慎重与C++11的auto关键字一起使用 eval() // force immediate evaluation // 用于等号左值,保持抽象表达式树,不计算表达式的值 // 屏蔽赋值前求值标志,目前仅有矩阵乘法具有该标志,因此仅对矩阵乘法有效 // 当Matrix类或Array类的同一个对象同时出现在赋值运算符两侧时不能使用,必须立即求值 noalias() // force lazy evaluation
资料
网站
- Eigen: Main Page
- [QuickRef] Dense matrix and array manipulations
- [QuickRef] Sparse linear algebra
- Eigen short ASCII reference
- eigen/Cookbook-ROS Wiki
GitHub
参考
- Eigen官网教程(1) Matrix相关-CSDN博客
- Eigen官网教程(2) Array类和元素级操作-CSDN博客
- Eigen官网教程(3) 块操作-CSDN博客
- Eigen官网教程(4) 高级初始化-CSDN博客
- Eigen官网教程(5) 规约、范数等-CSDN博客
- Eigen官网教程(6) Map类-CSDN博客
- Eigen官网教程(7) Geometry几何模块的实践-CSDN博客
- Eigen:基础入门到使用-CSDN博客
- Eigen:进阶使用-CSDN博客
- Catalogue of dense decompositions
- Linear algebra and decompositions
- Benchmark of dense decompositions
- Solving linear least squares systems
- LU分解、LDLT分解和Cholesky分解-CSDN博客
- 奇异值分解(SVD)-漫漫成长的文章-知乎
- SVD分解-CSDN博客
- 欧拉角细节/旋转顺序/内旋外旋-能儿的文章-知乎
- 欧拉角和旋转矩阵之间的转换-江南古镇的文章-知乎
- 内旋外旋证明-Stack Exchange
- 三维旋转:欧拉角、四元数、旋转矩阵、轴角之间的转换-鸡哥的文章-知乎
- 三维旋转的不同表示方式和相互转换-xiaotaw的文章-知乎
- 四元数归一化1-Stack Overflow
- 四元数归一化2-CSDN博客
- 四元数的球面线性插值(slerp)-一条放浪不羁的爬虫的文章-知乎
- 机械臂如何实现笛卡尔空间中姿态的插值?-fly qq的回答-知乎
- 机械臂如何实现笛卡尔空间中姿态的插值?-桂凯的回答-知乎
- 旋转矩阵归一化1-Stack Overflow
- 旋转矩阵归一化2-Stack Overflow
- Common pitfalls
- The template and typename keywords in C++
- Aliasing
- Alignement issues
- 向量化运算-CSDN博客
- Eigen内存对齐1-CSDN博客
- Eigen内存对齐2-CSDN博客
- 从Eigen向量化谈内存对齐-王金戈的文章-知乎
- Eigen内存对齐-卷儿的文章-知乎
- 一文带你了解Eigen内存对齐-王方浩的文章-知乎
- Eigen库在使用的过程出现warning:在堆上分配的对象可能不是对齐16,什么原因呢?-王方浩的回答-知乎
- C++深入解析new关键字,::new、operator new函数,placement new表达式-CSDN博客
- Eigen与std::make_shared,std::unique_ptr搭配使用的采坑记录-minxuan的文章-知乎
- Lazy Evaluation and Aliasing
- eager evaluation (及早求值) & lazy evaluation (惰性求值)-CSDN博客
- noalias()-CSDN博客
- Eigen常见的坑-管清文的文章-知乎