首页 | 电子创新网

深度神经网络训练的必知技巧

本文主要介绍8种实现细节的技巧或tricks

8个经过证实的方法：提高机器学习模型的准确率

我从实践中学习了到这些方法。相对于理论，我一向更热衷于实践。这种学习方式也一直在激励我。本文将分享 8 个经过证实的方法，使用这些方法可以建立稳健的机器学习模型。希望我的知识可以帮助大家获得更高的职业成就。

导语

提升一个模型的表现有时很困难。如果你们曾经纠结于相似的问题，那我相信你们中很多人会同意我的看法。你会尝试所有曾学习过的策略和算法，但模型正确率并没有改善。你会觉得无助和困顿，这是 90% 的数据科学家开始放弃的时候。

基于“视频图像”的人脸识别算法

一个典型的基于视频图像的人脸识别系统一般都是自动检测人脸区域，从视频中提取特征，最后如果人脸存在则识别出人脸的身份。在视频监控、信息安全和出入控制等应用中，基于视频的人脸识别是一个非常重要的问题，也是目前人脸识别的一个热点和难点。基于视频比基于静态图像更具优越性，因为 Bruce 等人和 Knight 等人已证明，当人脸被求反或倒转时，运动信息有助于（熟悉的）人脸的识别。虽然视频人脸识别是基于静态图像的人脸识别的直接扩展，但一般认为视频人脸识别算法需要同时用到空间和时间信息，这类方法直到近几年才开始受到重视并需要进一步的研究和发展。

视频人脸识别遇到的困难和挑战，具体来说有以下几种：

【盘点】掌握机器学习的5条必由之路

作者：Jason Brownlee
译者：刘小芹

【导读】作者在本文提出一种5步入门并应用机器学习的方法。它不是传统的方法。传统的机器学习方法提倡从下往上学，先从理论和数学开始，然后是算法实现，最后让你去解决现实世界的问题。

使用dlib中的深度残差网络(ResNet)实现实时人脸识别

opencv中提供的基于haar特征级联进行人脸检测的方法效果非常不好，本文使用dlib中提供的人脸检测方法（使用HOG特征或卷积神经网方法），并使用提供的深度残差网络（ResNet）实现实时人脸识别，不过本文的目的不是构建深度残差网络，而是利用已经训练好的模型进行实时人脸识别，实时性要求一秒钟达到10帧以上的速率，并且保证不错的精度。opencv和dlib都是非常好用的计算机视觉库，特别是dlib，前面文章提到了其内部封装了一些比较新的深度学习方法，使用这些算法可以实现很多应用，比如人脸检测、车辆检测、目标追踪、语义分割等等。由于这两个库相应的都包含了C++和Python的版本，而Python的配置和相对使用起来更加简单，因此这篇文章主要通过Python来实现。

彻底理解数字图像处理中的卷积——以Sobel算子为例

卷积在信号处理领域有极其广泛的应用，也有严格的物理和数学定义。本文只讨论卷积在数字图像处理中的应用。

在数字图像处理中，有一种基本的处理方法:线性滤波。待处理的平面数字图像可被看做一个大矩阵，图像的每个像素对应着矩阵的每个元素，假设我们平面的分辨率是 1024 * 768，那么对应的大矩阵的行数= 1024，列数=768 。

用于滤波的是一个滤波器小矩阵(也叫卷积核)，滤波器小矩阵一般是个方阵，也就是行数和列数相同，比如常见的用于边缘检测的 Sobel 算子就是两个 3*3 的小矩阵.

进行滤波就是对于大矩阵中的每个像素，计算它周围像素和滤波器矩阵对应位置元素的乘积，然后把结果相加到一起，最终得到的值就作为该像素的新值，这样就完成了一次滤波。

上面的处理过程可以参考这个示意图：

一文了解什么是语义分割及常用的语义分割方法有哪些？

语义分割是计算机视觉中的基础任务，我们通常会使用基于 CNN 加 CRF 的方法或直接使用对抗性的训练实现端到端的分割。本文简要介绍了这两种方法及它们的特点。

人类是如何描述场景的？我们可能会说「窗户下有一张桌子」，或者「沙发右边有一盏灯」。图像理解的关键在于将一个整体场景分解成几个单独的实体，这也有助于我们推理目标的不同行为。

当然，目标检测方法可以帮助我们绘制某些确定实体的边框，但人类对场景的理解能以像素级的精细程度对每一个实体进行检测并标记精确的边界。我们已经开始发展自动驾驶汽车和智能机器人，这些都需要深入理解周围环境，因此精确分割实体变得越来越重要。

什么是语义分割？

机器学习算法——聚类

聚类属于无监督学习，事先不知道数据会分为几类，通过聚类分析将数据聚合成几个群体。聚类是不需要对数据进行训练和学习的。主要的聚类算法有K-Means和DBSCAN。

K-Means算法的基本原理比较简单：
1.指定K值（数据要分成的簇的数目），并指定初始的k个质心；
2.遍历每个数据点，计算其到各个质心的距离，将其归类到距离最近的质心点；
3分类完毕后，求各个簇的质心，得到新的质心点；
4.重复2和3中的操作，计算新的质心与旧的质心之间距离，如果小于设定的误差值，则停止计算，否则继续进行迭代。

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

object detection我的理解，就是在给定的图片中精确找到物体所在位置，并标注出物体的类别。object detection要解决的问题就是物体在哪里，是什么这整个流程的问题。然而，这个问题可不是那么容易解决的，物体的尺寸变化范围很大，摆放物体的角度，姿态不定，而且可以出现在图片的任何地方，更何况物体还可以是多个类别。

object detection技术的演进：
RCNN->SppNET->Fast-RCNN->Faster-RCNN

人工智能和物联网时代，这十大良机不可错过！

近日，SAP针对网络经济未来发展趋势公布的研究报告《未来网络经济的99个趋势》显示，大数据、智能助手、共享经济等将成为未来网络经济的热门关键词。

1、到2020年，平均每个人都会与机器人有更多的对话。

值得注意的是，就在今年CES世界消费电子展上，多家科技公司推出了服务型机器人，其中一款Aeolus公司的家用服务机器人也是出尽风头，它不仅能够做为一个家庭保姆，干擦地板擦家具的脏活累活，还能够根据你的需求在冰箱为你取回需要的饮品等。未来一天，或许你日常交流的“家庭成员”之一就是一位机器人。

2、虽然51%的工作活动可以自动化，但是完全由机器替代的工作不到5%。

首页
前一页
…
794
795
796
797
798
799
800
801
802
…
下一页
末页