当深度强化学习遇到『羊了个yang』；AI开始研究『麻将』了？3类资料带你准备技术面试；机器学习资源列表；前沿论文 | ShowMeAI资讯日报_mujoco menagerie-程序员宅基地

技术标签：面试 ShowMeAI资讯日报首席AI资讯收纳官机器学习深度学习人工智能职场和发展

日报合辑 | 电子月刊 | 公众号下载资料 | @韩信子

工具&框架

『DI-sheep』深度强化学习 + 了个

https://github.com/opendilab/DI-sheep

当 AI 技术的明珠——深度强化学习，遇到号称『通关率只有0.01%』的『了个』，会碰撞出哪些奇思妙想呢？

本项目构建了『了个』游*戏操作环境，使用深度强化学习，对『只有2关却永远过不了第2关』的它进行学习，项目使用的算法和覆盖的功能仍在不断优化中。

『Mjx』麻将 AI 研究框架

https://github.com/mjx-project/mjx

Mjx 是一个日本麻将（riichi Mahjong）模拟器。作为一个游戏服务器，Mjx 与流行的麻将模拟器 Mjai 一样，用于评估麻将 AI，但有额外的功能。它具备以下特性：

快速
与 Tenhou 完全兼容
类似 Gym 的 API
易于分布式计算
兼容 Mjai
优美的可视化

『Azimutt』实体关系图(ERD)可视化工具

https://github.com/azimuttapp/azimutt

https://azimutt.app/

Azimutt 是一个实体关系图（ERD）的可视化工具，有各种过滤器和输入，帮助你了解你的数据库模式。

『mp4grep』用于转录和搜索音频/视频的命令行工具

https://github.com/o-oconnell/mp4grep

mp4grep 是一个转录和搜索音频文件的工具，为快速重复搜索缓存结果。mp4grep 附带 mp4grep-convert，可以将 mp3、mp4、ogg、webm、mov、wav 和 avi 转换为正确的格式。

『Menagerie』MuJoCo 物理引擎高质量模型级

https://github.com/deepmind/mujoco_menagerie

Menagerie 是 MuJoCo 物理引擎的高质量模型集，由 DeepMind 开发。一个物理模拟器的好坏取决于它所模拟的模型，而在像 MuJoCo 这样具有许多建模选项的强大模拟器中，很容易创建出不符合预期行为的『坏』模型。

这个集合的目的是为社区提供一个精心设计的模型库，这些模型一开始就能很好地工作：Shadow E3M5、Robotiq 2F-85、Cassie、ANYmal B、ANYmal C、Unitree A1、Panda、UR5e

博文&分享

『Interview Resources』技术面试资源列表

https://github.com/nas5w/interview-resources

这是一个技术面试的资源汇集地！主要包含三部分内容：Leetcode-Style 面试、行为面试、一些很不错的补充资源。

Leetcode-Style 面试：面试中在白板或计算机上解决一些算法/数据结构问题。面试官以此判断变成能力、批判性思维、沟通&解决问题的能力。此类面试，面试候选人需要传达出自己的决策力与权衡力，并解释解决方案的时间和空间复杂性。

行为面试：工程师通常需要处理模棱两可的问题，甚至在压力下处理棘手问题。公司通过一些问题来判断面试候选人的情商与同理心。

『Neural Speech Synthesis』(Interspeech 2022 Tutorial)神经语音合成教程

https://github.com/tts-tutorial/interspeech2022

语音合成由『文本到语音(TTS)』和『语音转换(VC)』等几个关键任务组成，一直是语音界的热门研究课题，在业界具有广泛的应用。近年来，随着深度学习和人工智能的发展，基于神经网络的语音合成显着提高了合成语音的质量。

在本教程中，作者对神经语音合成进行了全面的介绍，包括四个部分：

语音合成技术的历史和神经语音合成的分类
文本转语音的关键方法和应用
语音转换的关键方法和应用
神经语音合成的挑战和未来的研究方向

数据&资源

『Planning with Deep Neural Networks』深度网络规划相关文献资源列表

https://github.com/ndrwmlnk/planning-with-deep-neural-networks-a-survey

『Awesome Machine Unlearning』机器学习相关资源大列表

https://github.com/tamlhp/awesome-machine-unlearning

清单包含以下主题：

A Framework of Machine Unlearning / 机器学习的框架
Surveys
Model-agnostic / 模型不可知
Model-intrinsic / 模型内在性
Data-Driven / 数据驱动
Datasets / 数据集
- Type: Image / 图像
- Type: Tabular / 表格式
- Type: Text / 文本
- Type: Sequence / 序列
- Type: Graph / 图形

研究&论文

可以点击这里回复关键字日报，获取整理好的论文合辑。

公众号后台回复关键字日报，获取整理好的论文合辑。

科研进展

2022.09.09 『闭环检测』 General Place Recognition Survey: Towards the Real-world Autonomy Age

2022.09.06 『语音识别』 ASR2K: Speech Recognition for Around 2000 Languages without Audio

2022.08.18 『3D形状建模』 LoRD: Local 4D Implicit Representation for High-Fidelity Dynamic Human Modeling

论文：General Place Recognition Survey: Towards the Real-world Autonomy Age

论文时间：9 Sep 2022

领域任务：Loop Closure Detection, Simultaneous Localization and Mapping, 闭环检测，同时定位和建图(SLAM)

论文地址：https://arxiv.org/abs/2209.04497

代码实现：https://github.com/MetaSLAM/GPRS

论文作者：Peng Yin, Shiqi Zhao, Ivan Cisneros, Abulikemu Abuduweili, Guoquan Huang, Micheal Milford, Changliu Liu, Howie Choset, Sebastian Scherer

论文简介：A summary of this work and our datasets and evaluation API is publicly available to the robotics community at https://github.com/MetaSLAM/GPRS /这项工作的摘要以及我们的数据集和评估API已公开提供给机器人社区 https://github.com/MetaSLAM/GPRS

论文摘要：地点识别是能够协助同步定位和绘图（SLAM）的基本模块，用于长期导航的环形封闭检测和重新定位。在过去的20年里，地点识别界取得了惊人的进展，这引起了广泛的研究兴趣，并在计算机视觉和机器人学等多个领域得到应用。然而，在复杂的真实世界场景中，很少有方法显示出有希望的地点识别性能，因为长期和大规模的外观变化通常会导致失败。此外，在最先进的方法中缺乏一个综合的框架，可以处理场所识别中的所有挑战，包括外观变化、视角差异、对未知区域的鲁棒性以及在现实世界中的应用效率。在这项工作中，我们调查了针对长期定位的最先进的方法，并讨论了未来的方向和机会。我们首先调查了长期自主性中地点识别的表述以及现实世界环境中的主要挑战。然后，我们回顾了最近针对不同传感器模式的地点识别工作，以及当前处理各种地点识别挑战的策略。最后，我们回顾了现有的长期定位的数据集，并介绍了我们的数据集和针对不同方法的评估API。本文可以作为新加入地点识别社区的研究人员和那些关心长期机器人自主性的研究人员的教程。我们还提供了我们对机器人学中经常问到的问题的看法。机器人是否需要准确的定位来实现长期的自主性？这项工作的摘要以及我们的数据集和评估API已公开提供给机器人社区 https://github.com/MetaSLAM/GPRS

论文：ASR2K: Speech Recognition for Around 2000 Languages without Audio

论文时间：6 Sep 2022

领域任务：speech-recognition, Speech Recognition，语音识别

论文地址：https://arxiv.org/abs/2209.02842

代码实现：https://github.com/xinjli/asr2k

论文作者：Xinjian Li, Florian Metze, David R Mortensen, Alan W Black, Shinji Watanabe

论文简介：We achieve 50% CER and 74% WER on the Wilderness dataset with Crubadan statistics only and improve them to 45% CER and 69% WER when using 10000 raw text utterances./我们在Wilderness数据集上仅用Crubadan的统计数据就取得了50%的CER和74%的WER，在使用10000个原始文本语料时，将其提高到45%的CER和69%的WER。

论文摘要：最近的大多数语音识别模型都依赖于大型监督数据集，而这些数据集对于许多低资源的语言来说是不可用的。在这项工作中，我们提出了一个不需要目标语言的任何音频的语音识别管道。唯一的假设是，我们可以获得原始文本数据集或一组n-gram统计数据。我们的语音管道由三个部分组成：声学、发音和语言模型。与标准管道不同，我们的声学和发音模型使用多语言模型，没有任何监督。语言模型是使用n-gram统计或原始文本数据集建立的。我们通过与Crubadan：一个大型的濒危语言n-gram数据库相结合，为1909种语言建立语音识别。此外，我们在两个数据集的129种语言上测试我们的方法。通用语音和CMU荒野数据集。在Wilderness数据集上，我们仅用Crubadan的统计数据就取得了50%的CER和74%的WER，当使用10000个原始文本语料时，我们将其提高到45%的CER和69%的WER。

论文：LoRD: Local 4D Implicit Representation for High-Fidelity Dynamic Human Modeling

论文时间：18 Aug 2022

领域任务：3D Shape Modeling，3D形状建模

论文地址：https://arxiv.org/abs/2208.08622

代码实现：https://github.com/BoyanJIANG/LoRD

论文作者：Boyan Jiang, Xinlin Ren, Mingsong Dou, xiangyang xue, Yanwei Fu, yinda zhang

论文简介：Recent progress in 4D implicit representation focuses on globally controlling the shape and motion with low dimensional latent vectors, which is prone to missing surface details and accumulating tracking error./4D隐含表示法的最新进展集中在用低维潜伏矢量全局控制形状和运动，这很容易遗漏表面细节并积累跟踪误差。

论文摘要：4D隐式表征的最新进展集中在用低维潜伏向量全局控制形状和运动，这容易遗漏表面细节和积累跟踪误差。虽然许多深度局部表征在三维形状建模中显示出了很好的效果，但其四维对应物还不存在。在本文中，我们通过提出一种新型的动态衣着人的局部4D隐含表征（LoRD）来填补这一空白，该表征具有4D人体建模和局部表征的优点，并能对详细的表面变形（如衣服皱纹）进行高保真重建。特别是，我们的关键见解是鼓励网络学习本地部件级表征的潜在代码，能够解释本地几何和时间变形。为了在测试时间进行推理，我们首先估计身体内部的骨架运动，以便在每个时间步长跟踪局部部位，然后根据不同类型的观察数据，通过自动解码优化每个部位的潜伏代码。大量的实验表明，所提出的方法具有很强的表现4D人类的能力，并在实际应用中优于最先进的方法，包括从稀疏点重建4D，非刚性深度融合，无论是定性还是定量。

我们是 ShowMeAI，致力于传播AI优质内容，分享行业解决方案，用知识加速每一次技术成长！

◉ 点击 日报合辑，在公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。

◉ 点击 电子月刊，快速浏览月度合辑。

◉ 点击这里，回复关键字日报获取AI电子月刊与论文 / 电子书等资料包。

ShowMeAI 致力于传播AI优质内容，分享行业解决方案，用知识加速每一次技术成长！点击专栏，查看历史消息。公众号（ShowMeAI研究中心）回复关键字日报，可以获取资源包（资料整理汇总与AI电子月刊）。

本文链接：https://blog.csdn.net/ShowMeAI/article/details/127051611

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

VS2017下dll和lib的使用_vsllb-程序员宅基地

文章浏览阅读3.8k次。前言最近开始认真掌握VS的各种操作，自然而然避不开dll和lib的使用，自己逛了逛CSDN和博客园，看了很多博客，但是并不是很让我满意，一方面是大多不符合我的环境（VS2017 Community）,另一方面是太他妈复杂了，什么建成后又各种添加什么的，实在记不熟，所以以下是我的操作。说明如下：环境：VS2017 Community操作：同一个结局解决方案下一个exe项目，一个dll项目，一..._vsllb

MSYS2 更换国内源_msys2 mingw 64-bit替换源-程序员宅基地

文章浏览阅读1.6k次，点赞5次，收藏4次。文章目录MSYS2 更换国内源MSYS2 更换国内源使用默认的 MSYS2 源升级软件或是安装新软件的特别的慢。所以就翻了翻国内的几个开源软件的镜像库，发现中科大的库里就有 MSYS2。所以就研究了一下，给 MSYS2 添加了中科大的源。简单的说 msys64\etc\pacman.d 目录下有三个文件。mirrorlist.msysmirrorlist.mingw64mirrorlist.mingw32这三个文件记录了都有哪些源。下面把我添加之后的文件内容贴上来。首先是 mirrorlis_msys2 mingw 64-bit替换源

Stm8 串口重定向及问题解决_error[li009]: runtime model conflict: module xxexi-程序员宅基地

文章浏览阅读1.4k次。一，代码及其设置#include <stdio.h>int fputc(int ch, FILE *f)//Stm8005 重定向{ while (!(UART2->SR&0x80)); UART2->DR=ch; return ch;}同时需要修改IAR的Projec t- >Options -> General..._error[li009]: runtime model conflict: module xxexit.o(dbgstm8smn.a) specifie

Java Utils工具类大全_utils.getapp（） java-程序员宅基地

文章浏览阅读1.8w次，点赞4次，收藏69次。源码和jar见：https://github.com/evil0ps/utils#Java Utils封装了一些常用Java操作方法,便于重复开发利用.另外希望身为Java牛牛的你们一起测试和完善，欢迎入群263641914 一起封装和完成常用的Java代码。节约撸码时间以方便有更多的时间去把妹子～#开发环境Win7x64JDK1.7IDEA14#项目结构│ README.m..._utils.getapp（） java

linux离线断网环境，安装virtualenv和django，创建项目虚拟环境和安装依赖包，_linux离线安装django-程序员宅基地

文章浏览阅读3.2k次。离线安装virtualenv和django工作中需要离线安装django，记录下：环境：离线机器系统：centos 6.5 python 版本： python 2.6.6 virtualenv 版本： 1.9 django 版本： 1.6.11 离线安装virtualenv 下载安装包 $ curl -O https://pypi.python.o..._linux离线安装django

Debian10 安装桌面亲测有效-程序员宅基地

文章浏览阅读1.3w次，点赞5次，收藏23次。在Debian 10上安装桌面环境如果在安装过程中没有选择桌面，只是安装了标准系统Debian提供了一个命令行工具（tasksel）来简化桌面环境的安装，只需运行如下命令即可：$ sudo tasksel然后，你可以从列表中选择所需的桌面环境，如下图所选的是Cinnamon：从要安装的软件列表中选择Cinnamon，然后使用选择“ok”：稍等片刻，注销或者重启即可..._debian10 安装桌面

随便推点

（Python数字图像处理）自适应中值滤波算法_图像滤波椒盐噪声自适应中值滤波-程序员宅基地

文章浏览阅读5.7k次，点赞21次，收藏55次。文章目录一、实现方法二、代码运行结果一、实现方法自适应中值滤波算法有两个处理层次：**层次A：**若zmin<zmed<zmax，则转移到层次B；否则，增Sxy尺寸，若Sxy<Smax，则重复层次A；否则，输出zmed。**层次B：**若zmin<zxy<zmax，则输出zxy；否则，输出zmed。既然是中值滤波，那处理椒盐这类冲激噪声肯定比较合适，自适应中值滤波能在有效去除冲激噪声的基础上，平滑其他非冲激噪声，减少失真，保留图像细节，而对于同等大小的中_图像滤波椒盐噪声自适应中值滤波