除了Kaggle,这里还有一些高质量的数据科学竞赛平台-程序员宅基地

技术标签: 算法  python  机器学习  编程语言  大数据  

选自 towardsdatascience

者: Parul Pande

机器之心编译

参与:李诗萌、王淑婷

除了大名鼎鼎的 kaggle,数据科学家可以参加的数据竞赛平台其实还蛮多的。有些比赛平台不仅提供比赛,还让你有机会自己创办比赛。有些比赛由公司赞助,有些由政府机构赞助。参加这些比赛不仅能让你的能力获得认可,还可以获得一些不菲的奖金呢~

在听了上百节慕课(MOOC)、看了上千本书和笔记、聆听了上百万人对数据科学的看法后,你会做什么呢?你要开始应用这些概念啦。应用机器学习概念的唯一方法就是亲自动手。你可以在感兴趣的领域选一些现实问题,也可以参加编程马拉松(Hackathon)和机器学习竞赛。

数据科学比赛不仅是算法的应用。从本质上讲算法是一种工具,任何人都可以写几行代码来使用它。参加这些比赛的主要原因是它们能提供很好的学习机会。当然,竞赛中的问题和现实问题不一定一样,但这些平台可以让你将学到的知识付诸实践,还能让你了解自己和他人的差距。

参加数据科学比赛的好处

参加这些比赛可以说是有百利而无一害。它里里外外的好处有很多,比如:

  • 这是一个学习的好机会;

  • 可以接触当前最佳的方法和数据集;

  • 可以和志同道合的人交往,团队合作很棒的地方在于可以从不同角度思考问题;

  • 可以向世界展现你的才华,从而获得更好的就职机会;

  • 参与并了解自己在排行榜上的表现也很好玩;

  • 还有奖品作为额外福利,但不应把它作为唯一的标准。

2009 年 9 月 18 日,BellKor Pragmatic Chaos 团队在决赛中获胜,正式赢得 NetFlix 的比赛。

Kaggle 是很有名的数据科学竞赛平台。这个在线社区有 10 万多注册用户,这些用户有新手也有专家。但除了 Kaggle,还有一些其它值得了解和研究的数据挖掘竞赛平台。

Driven Data

Driven Data 举办数据科学竞赛的目的是要建设更美好的世界,用最先进的预测模型来解决世界上最棘手的问题。Driven Data 在国际发展、医疗、教育、研究和保护以及公共服务等领域举办数据科学竞赛,以谋求社会利益。你既可以参加平台上的竞赛,也可以通过该平台举办自己的竞赛。

该网站有专门的示例项目部分,这部分以案例研究的形式展示了一些成功的项目。Driven Data 列出的数据集都与一些非营利组织相关,数据从野生动物保护到公共卫生都有。因此,如果你想将自己的技能应用于实际问题,那这个平台简直就是为你而建的。

  • Driven Data:https://www.drivendata.org/

  • 参加比赛:https://www.drivendata.org/competitions/

  • 组织比赛:https://www.drivendata.org/partners/

  • 示例项目:http://drivendata.co/projects.html

CrowdANALYTIX

CrowdANALYTIX 是一个众包分析平台,该平台将商业上的挑战和问题转换成竞赛题目。CroudANALYTIX 社区通过合作与竞争的方式来构建和优化 AI、ML、NLP 和 深度学习算法。该平台还有社区博客,其中有包括访谈和参考资料在内的大量资源。

  • CrowdANALYTIX:https://www.crowdanalytix.com/community

  • Community Blog:https://www.crowdanalytix.com/jq/communityBlog/listBlog.html

Innocentive

InnoCentive 的重点在生命科学上,但也有其它有趣的竞赛主题。参赛者可以参与解决一些世界上最紧迫的问题——从促进家用净水供应到旨在吸引和杀死携带疟疾的蚊子的被动式太阳能装置。挑战是真正的问题,它需要持续集中注意力、批判性思维、研究、创造力以及综合性知识。开发出解决方案就是最大的奖励,在这个过程中还可以进行无与伦比的脑力锻炼。

InnoCentive:https://www.innocentive.com/our-solvers/

TunedIT

TuneIT 最初是华沙大学(University of Warsaw)的一个理科博士项目,其目的是帮助数据挖掘科学家进行可重复的实验并轻松评估数据驱动算法。后来出于教育、科研以及商业目的,补充了用于举办数据竞赛的 TunedIT Challenges 平台。

  • TunedIT:http://tunedit.org/

  • TunedIT Challenges:http://tunedit.org/challenges

Codalab

Codalab 是一个基于 web 端的开源平台,平台上的研究人员、开发人员以及数据科学家互相合作,以推进使用机器学习和高级计算的研究领域的发展。CodaLab 通过其在线社区解决数据导向研究领域的很多常见问题,人们可以在该社区共享 worksheets 并参与竞赛。你既可以参加现有竞赛,也可以举办新的竞赛。

CodaLab:https://competitions.codalab.org/

Analytics Vidhya

Analytics Vidhya 除了为分析和数据科学专业人士提供了基于社区的知识门户,还提供了大量数据科学的学习资源。该平台还会举办编程马拉松,通过竞赛形式解决真实的行业问题。你既可以参加竞赛,也可以赞助编程马拉松。大多数在 Analytics Vidhya 上组织编程马拉松的公司,都会给表现优异的参赛者提供很好的工作机会。

Analytics Vidhya:https://datahack.analyticsvidhya.com/?utm_source=main-logo

CrowdAI

数据科学挑战平台 crowdAI 每年都会举办很多开放的数据科学挑战赛。这些比赛覆盖了图像分类、文本识别、强化学习、对抗攻击、图像分割、资源配置优化等多个领域。2017 年亚马逊和英伟达赞助的竞赛叫做「Learning to Run」,奖金高达 10 万多美元。

  • crowdAI:https://www.crowdai.org/challenges

  • Learning to Run:https://www.crowdai.org/challenges/nips-2017-learning-to-run

Numerai

Numerai 是由众多数据科学家建立的、AI 运营的众包对冲基金平台。该平台每周都会举办数据科学竞赛以支持真正的对冲基金。Numerai 每周给参赛者提供加密数据,然后参赛者们提交其预测值。之后 Numerai 会根据所有提交结果构建元模型,并进行投资。

数据科学家们提交自己的预测值来换取一些 Numeraire,这是一种以太坊区块链上的加密货币。

Numerai:https://numer.ai/rounds

天池

天池是阿里云创建的数据竞赛平台,它和 Kaggle 很像。该社区中有成千上万互相合作的数据科学家,他们还可以在该平台中联系全球的企业和政府,以解决各行业中最棘手的问题。

天池:https://tianchi.aliyun.com/competition/gameList/activeList

DataScienceChallenge

Data Science Challenges 是由国防科学技术实验室(Dstl)以及包括政府科学办公室(Government Office for Science)、SIS 和 MI5 在内的许多英国政府部门共同赞助举办的,旨在鼓励数据科学领域的优秀人才解决现实问题。该平台提供的两个挑战赛现在已经结束了,但很快就会出现新的问题,这些比赛将鼓励你找出现实问题的非正统答案。

Data Science Challenges:https://www.datasciencechallenge.org/

此外还有一些每年仅举办一次的比赛。

KDD CUP

KDD Cup 是 ACM 的数据挖掘及知识发现专委会(SIGKDD)组织的数据挖掘与知识发现竞赛,该竞赛一年举办一次,是数据挖掘人才的顶级专业盛会。KDD-2019 将于 2019 年 8 月 4 日至 8 月 8 日在美国阿拉斯加州的安克雷奇举行。

KDD-2019:https://www.kdd.org/kdd2019/kdd-cup

VizDoom AI competition(VDAIC)

ViZDoom 是基于 Doom 的 AI 研究平台,通过原始视觉信息进行强化学习。Visual Doom AI 竞赛的参赛者要提交可以玩 Doom 的控制器(C++、Python 或 Java 均可)。

ViZDoom:https://www.crowdai.org/challenges/visual-doom-ai-competition-2018-singleplayer-track-1/leaderboards

结论

尽管这个名单会随着时间推移而有所改变,但你最终会找到自己最感兴趣的比赛。那么,加油吧!

原文链接:https://towardsdatascience.com/top-competitive-data-science-platforms-other-than-kaggle-2995e9dad93c

------- End -------

点右下角「在看」与转发

是对我们最大的支持

特别推荐下公众号「价值前瞻」,分享读书、成长和投资思考,欢迎来串门。

回复「书单」 可获取精选书单一份,包括《如何阅读 一本书》、《巴菲特之道》、《金字塔原理》、高瓴张磊的《价值》、《投资最重要的事》、《戴维斯王朝》等书籍的笔记内容或思维导图

价 值 前 瞻

做一个有远见的人

扫码关注,查看更多内容

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/lemonbit/article/details/114109180

智能推荐

使用nginx解决浏览器跨域问题_nginx不停的xhr-程序员宅基地

文章浏览阅读1k次。通过使用ajax方法跨域请求是浏览器所不允许的,浏览器出于安全考虑是禁止的。警告信息如下:不过jQuery对跨域问题也有解决方案,使用jsonp的方式解决,方法如下:$.ajax({ async:false, url: 'http://www.mysite.com/demo.do', // 跨域URL ty..._nginx不停的xhr

在 Oracle 中配置 extproc 以访问 ST_Geometry-程序员宅基地

文章浏览阅读2k次。关于在 Oracle 中配置 extproc 以访问 ST_Geometry,也就是我们所说的 使用空间SQL 的方法,官方文档链接如下。http://desktop.arcgis.com/zh-cn/arcmap/latest/manage-data/gdbs-in-oracle/configure-oracle-extproc.htm其实简单总结一下,主要就分为以下几个步骤。..._extproc

Linux C++ gbk转为utf-8_linux c++ gbk->utf8-程序员宅基地

文章浏览阅读1.5w次。linux下没有上面的两个函数,需要使用函数 mbstowcs和wcstombsmbstowcs将多字节编码转换为宽字节编码wcstombs将宽字节编码转换为多字节编码这两个函数,转换过程中受到系统编码类型的影响,需要通过设置来设定转换前和转换后的编码类型。通过函数setlocale进行系统编码的设置。linux下输入命名locale -a查看系统支持的编码_linux c++ gbk->utf8

IMP-00009: 导出文件异常结束-程序员宅基地

文章浏览阅读750次。今天准备从生产库向测试库进行数据导入,结果在imp导入的时候遇到“ IMP-00009:导出文件异常结束” 错误,google一下,发现可能有如下原因导致imp的数据太大,没有写buffer和commit两个数据库字符集不同从低版本exp的dmp文件,向高版本imp导出的dmp文件出错传输dmp文件时,文件损坏解决办法:imp时指定..._imp-00009导出文件异常结束

python程序员需要深入掌握的技能_Python用数据说明程序员需要掌握的技能-程序员宅基地

文章浏览阅读143次。当下是一个大数据的时代,各个行业都离不开数据的支持。因此,网络爬虫就应运而生。网络爬虫当下最为火热的是Python,Python开发爬虫相对简单,而且功能库相当完善,力压众多开发语言。本次教程我们爬取前程无忧的招聘信息来分析Python程序员需要掌握那些编程技术。首先在谷歌浏览器打开前程无忧的首页,按F12打开浏览器的开发者工具。浏览器开发者工具是用于捕捉网站的请求信息,通过分析请求信息可以了解请..._初级python程序员能力要求

Spring @Service生成bean名称的规则(当类的名字是以两个或以上的大写字母开头的话,bean的名字会与类名保持一致)_@service beanname-程序员宅基地

文章浏览阅读7.6k次,点赞2次,收藏6次。@Service标注的bean,类名:ABDemoService查看源码后发现,原来是经过一个特殊处理:当类的名字是以两个或以上的大写字母开头的话,bean的名字会与类名保持一致public class AnnotationBeanNameGenerator implements BeanNameGenerator { private static final String C..._@service beanname

随便推点

二叉树的各种创建方法_二叉树的建立-程序员宅基地

文章浏览阅读6.9w次,点赞73次,收藏463次。1.前序创建#include<stdio.h>#include<string.h>#include<stdlib.h>#include<malloc.h>#include<iostream>#include<stack>#include<queue>using namespace std;typed_二叉树的建立

解决asp.net导出excel时中文文件名乱码_asp.net utf8 导出中文字符乱码-程序员宅基地

文章浏览阅读7.1k次。在Asp.net上使用Excel导出功能,如果文件名出现中文,便会以乱码视之。 解决方法: fileName = HttpUtility.UrlEncode(fileName, System.Text.Encoding.UTF8);_asp.net utf8 导出中文字符乱码

笔记-编译原理-实验一-词法分析器设计_对pl/0作以下修改扩充。增加单词-程序员宅基地

文章浏览阅读2.1k次,点赞4次,收藏23次。第一次实验 词法分析实验报告设计思想词法分析的主要任务是根据文法的词汇表以及对应约定的编码进行一定的识别,找出文件中所有的合法的单词,并给出一定的信息作为最后的结果,用于后续语法分析程序的使用;本实验针对 PL/0 语言 的文法、词汇表编写一个词法分析程序,对于每个单词根据词汇表输出: (单词种类, 单词的值) 二元对。词汇表:种别编码单词符号助记符0beginb..._对pl/0作以下修改扩充。增加单词

android adb shell 权限,android adb shell权限被拒绝-程序员宅基地

文章浏览阅读773次。我在使用adb.exe时遇到了麻烦.我想使用与bash相同的adb.exe shell提示符,所以我决定更改默认的bash二进制文件(当然二进制文件是交叉编译的,一切都很完美)更改bash二进制文件遵循以下顺序> adb remount> adb push bash / system / bin /> adb shell> cd / system / bin> chm..._adb shell mv 权限

投影仪-相机标定_相机-投影仪标定-程序员宅基地

文章浏览阅读6.8k次,点赞12次,收藏125次。1. 单目相机标定引言相机标定已经研究多年,标定的算法可以分为基于摄影测量的标定和自标定。其中,应用最为广泛的还是张正友标定法。这是一种简单灵活、高鲁棒性、低成本的相机标定算法。仅需要一台相机和一块平面标定板构建相机标定系统,在标定过程中,相机拍摄多个角度下(至少两个角度,推荐10~20个角度)的标定板图像(相机和标定板都可以移动),即可对相机的内外参数进行标定。下面介绍张氏标定法(以下也这么称呼)的原理。原理相机模型和单应矩阵相机标定,就是对相机的内外参数进行计算的过程,从而得到物体到图像的投影_相机-投影仪标定

Wayland架构、渲染、硬件支持-程序员宅基地

文章浏览阅读2.2k次。文章目录Wayland 架构Wayland 渲染Wayland的 硬件支持简 述: 翻译一篇关于和 wayland 有关的技术文章, 其英文标题为Wayland Architecture .Wayland 架构若是想要更好的理解 Wayland 架构及其与 X (X11 or X Window System) 结构;一种很好的方法是将事件从输入设备就开始跟踪, 查看期间所有的屏幕上出现的变化。这就是我们现在对 X 的理解。 内核是从一个输入设备中获取一个事件,并通过 evdev 输入_wayland

推荐文章

热门文章

相关标签