人工智能职业发展道路完整指南
admin
2023-08-13 06:00:51
0
声名:
本文原文来自 towardsml
译者:@龙哥学Python
仅供参考、学习和交流所用

关于人工智能职业,我们总是存在有太多的疑惑和问题!在决定职业道路时,缺乏清晰的思路会让人感到压力很大。我不准备再继续回答一些个别的问题,而是决定一劳永逸地解决它们,即撰写此文为大家彻底揭晓“开发一个人工智能项目涉及到各种技术角色和任务”这一问题!

在这篇文章中,我们将讨论以下内容:

  1. AI 项目中的角色和任务。
  2. 理解 AI 生命周期中各任务的来龙去脉。
  3. 理解 AI 生命周期中各角色的来龙去脉。
  4. 职业领域(谁在招聘人工智能人才,人工智能的分支,未来展望)。
  5. 学习资源。

1. AI 项目的角色和任务

人工智能项目不是一个人的壮举。它涉及各种不同的任务和角色。这意味着人工智能团队中拥有着专注于产品生命周期不同部分的各色人员。下面是主要技术角色的可视化表示,以及它们与开发周期中各任务的关系:




AI 团队中的各种角色

(行-角色,自上到下分别为软件工程师、机器学习/人工智能工程师、数据分析、数据科学家、应用科学家、机器学习/人工智能研究员;列-任务,从左至右分别为数据工程、建模、部署、业务分析、基础架构、研究-发表论文)

说明:绿色表示该角色的主要任务。黄色表示次要任务,即他们有时会做的事情,不需要精通它们。红色表示该角色不需要进行的任务。

请注意:

  • 维持一个成功的 AI 团队所需的确切角色数量取决于项目的规模。并不是所有的团队都需要分配上面提到的所有技术角色。例如,AI 团队通常不需要研究员。
  • 此外,这些角色和任务之间的确切界限可能因公司而异。例如,有些团队可能同时有应用科学家和数据科学家,而另一些团队可能同时有 ML 工程师和数据科学家;再如,一些公司可能同时拥有数据分析师和数据科学家,而另一些公司可能只雇佣具有强大业务头脑的数据科学家,而没有雇佣数据分析师。这些界限往往是模糊的,尤其是在初创公司。

首先要明确一些基本的点!

在深入讨论更多细节之前,让我们先快速确认一下人工智能、机器学习、深度学习以及数据科学之间的关系,以确保我们对基本的点有一个清晰的了解:




人工智能、机器学习、深度学习以及数据科学之间的关系

(AI-通过机器展示人类的智能;机器学习-一个实现人工智能的方法;深度学习-一种实现机器学习的技术;数据科学-高级分析、统计、部分机器学习在商业环境中的实际应用。四类技术的包含关系如图所示。)

2. AI 生命周期中各任务的来龙去脉

i. 数据工程

  • 任务描述:准备数据(来自各种数据库的输入),并将其转换为 AI 生命周期中如分析师、数据科学家等其他人容易使用的格式。
  • 所需技能:编码和软件工程技能,广度根据项目规模的不同而不同。
  • 使用的工具:数据库查询语言(如SQL)和面向对象编程语言(如Python、c#和Java)。Apache Spark 等大数据工具也被广泛使用。

ii. 建模

  • 任务描述:根据用例,在数据中寻找 patterns,以辅助企业进行决策的制定以及(或者)实现流程自动化。例如,一个房地产模型可以用来预测房屋的销售价格,而一个计算机视觉模型可以用来自动检测在制造过程中有问题的项目。
  • 所需技能:数学、数据科学和机器学习。
  • 使用的工具:Python、TensorFlow、PyTorch。

iii. 部署

  • 任务描述:向终端用户提供AI解决方案,将数据与模型结合,并将端到端解决方案投入生产。
  • 技能要求:具有较强的编码和后端工程技能,能够编写鲁棒且可扩展的产品代码。
  • 使用的工具:面向对象的编程语言,如Python、c#和Java,以及云技术,如Azure和AWS。

iv. 业务分析

  • 任务描述:评估部署模型的性能及其对业务的影响。例如,用户的点击数据可以用来评估推荐模型的性能,并了解它是否提供了预期的商业价值。
  • 所需技能:业务头脑,数据科学分析,良好的沟通和数据展示能力。
  • 使用的工具:Excel、PowerPoint、Power BI等演示分析工具、A/B测试软件。有时可能需要Python之类的编程语言。

v. 人工智能基础设施

  • 任务描述:构建和维护可靠、快速、安全、可扩展的软件基础设施,以支持AI开发周期中的所有组件。例如,YouTube的基础设施需要能够以无缝的方式处理每天50亿个视频的观看!
  • 技能要求:较强的软件工程技能。
  • 使用的工具:面向对象的编程语言(如Python、Java或c#)和云技术(如Azure和AWS)。

vi. 研究

  • 任务描述:深入研究特定的研究领域/问题,以改进当前的最新技术为目标,了解该领域的最新发展,并发表论文。
  • 技能要求:较强的分析和批判性思维,写作能力,坚持、专注等等特质!
  • 使用的工具:跟进学术前沿的渠道,如学术出版物、Arxiv、Twitter,以及会议(如NeurIPS、ICLR 和 ACM)。建模工具 Python、PyTorch 和/或 TensorFlow。

3. AI 生命周期中各角色的来龙去脉

i. 软件工程师

需要从事数据工程和核心基础设施工作。这意味着需要强大的编码和软件工程技能,如算法和分布式系统的知识。

ii. 数据科学家

此角色需要处理数据工程、建模和业务分析任务。所需的技能水平,例如工程的广度和深度以及所需的商业智慧,会根据整个团队的组成(下面几个角色的描述将会使这一点更清楚,特别是参见应用科学家vs数据科学家)和项目的规模而变化。

iii. ML/AI工程师

该角色需要执行数据工程、建模、部署和AI基础设施任务。这是一个多才多艺的角色,可以被视为软件工程师+数据科学家的组合,具有比数据科学技能更强的工程技能。

Ⅳ. 应用科学家

这个角色是软件工程师+数据科学组合的另一个变体。

ML/AI工程师 VS 应用科学家:与ML/AI工程师相比,应用科学家更注重数据科学技能,而不是软件工程。

数据科学家 VS 应用科学家:在既有数据科学家又有应用科学家的团队中,应用科学家倾向于处理更高级的ML概念(深度学习),而数据科学家可能是具有更强业务头脑的人。

Ⅴ. 数据分析师

该角色负责数据工程和业务分析任务。然而,与其他角色处理数据工程,数据分析师不需要适当的编码和软件工程技能——他们的任务可以通过使用查询语言SQL和使用交互式工具等电力BI和Excel等(见“技能和工具”在“业务分析”任务详细信息)。

Ⅵ. AI /ML 研究员

研究人员非常专注于利用他们强大的科学技能进行建模。他们致力于改进现有的最先进的模型。在行业环境中,他们为人工智能开发周期中的其他人(如数据和应用科学家)提供指导,指导如何使用人工智能改进当前的解决方案和创新。

4. 职业领域

a. 谁在招聘人工智能角色

微软、谷歌、亚马逊、Facebook、Netflix、IBM、Uber等科技巨头是这个领域的最佳工作场所,因为除了从事尖端技术,你还可以开发直接影响数十亿终端用户的产品:

Cortana, Alexa,谷歌翻译,PPT设计师,Outlook和Gmail中的智能回复和智能撰写,YouTube和Netflix推荐,面部识别,People You May Know(你可能知道的人),Pages You Might Like(你可能喜欢的页面), Food Delivery Estimates(食物交付估计), Friends Suggestions(朋友建议), Feed Ranking(动态排名),并且这个列表的内容还在持续增加。

然而,人工智能的应用如此多样,几乎每个行业现在都在拥抱人工智能,并在其垂直领域招聘人才。让我们看看一些不太明显的领域以及它们对AI的使用:

  • 金融:欺诈检测、与之相比人类没有竞争力的预测和执行交易的速度和数量。
  • 医学:医学诊断、药物发现、了解大范围疾病的风险因素、帮助各科医生的专家系统、重症监护病房的监测和控制、假肢设计。
  • 机器人:视觉控制,运动控制,学习,合作行为。
  • 工程:故障诊断、预测维护、智能控制系统、智能制造系统。
  • 市场营销:更具针对性、相关性和及时性的市场营销方案。
  • 在线客户支持:聊天机器人将取代客户支持代表。
  • 太空:NASA使用人工智能来帮助计划和安排航天飞机的维护。
  • 军事:大量资金流入这里,但细节是机密信息!

b. AI分支

从上面的例子中我们可以看到,AI的应用可以是非常多样的。为了更好地说明这一点,下面介绍一下AI分支:




AI分支(机器学习ML、自然语言处理NLP、专家系统、视觉、语音、规划、机器人)

(机器学习ML:深度学习、有监督学习、无监督学习;自然语言处理NLP:内容提取、分类、机器翻译、问答、文本生成;专家系统;视觉:图像识别、机器视觉;语音:语音转写、语音合成;规划;机器人)

c.未来展望

此外,麦肯锡研究中心也提供了一些值得关注的行业洞察:




“在我们超过三分之二的用例中,人工智能在性能提高上远超过其他的分析技术。”

5. 学习资源

此时,您应该能够缩小所需工具和技能的范围。此时,你应该能够找到很多相关的资源,例如:

  • 课程、训练营和证书
  • 博客

a.书的建议

机器学习:Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems

统计学:Practical Statistics for Data Scientists: 50 Essential Concepts

数据科学:Python Data Science Handbook

商业分析:Storytelling with Data: A Data Visualization Guide for Business Professionals

b.在线课程

以下是一些很棒的在线课程和专业:

对于机器学习和深度学习的深入研究,我强烈推荐Andrew Ng(斯坦福大学教授)在Coursera上的课程:

  • Machine Learning
  • Deep Learning Specialization
  • AI for Medicine Specialization

除了Coursera,fast.ai也是一个学习深度学习的好地方。

为了以有趣和互动的方式学习Data Science in Python,这里有一个你非常喜欢的课程!:)

不用说,那里有大量的资源。如果你想让我在某些特定领域提供进一步的推荐(书籍/博客/课程),请在评论中告诉我。

最终的想法

人工智能是一个相对较新的、发展迅速的领域,所以有很多困惑是可以理解的。我希望这篇简明而全面的指南对你有所帮助,你会对你想要追求的AI的途径有一个更清晰的认识。

同样,(在求职中)请阅读职位描述,并对你申请的公司/团队做些调查,以了解他们的职位描述对应哪些角色——不要只依赖于头衔。

这种详解性指南并不容易找到,所以如果你觉得这篇文章有深刻的见解,请将它分享给其他人,他们也会从中受益。谢谢!

最后,请记住,无论你最终选择哪条道路,最重要的是你的职业选择应该反映你的价值观。

祝你一路顺风!

参考资料

  • https://www.deeplearning.ai/
  • https://www.mckinsey.com/featured-insights/artificial-intelligence/notes-from-the-ai-frontier-applications-and-value-of-deep-learning
  • https://www.neotalogic.com/2016/02/28/artificial-intelligence-in-law-the-state-of-play-2016-part-1/

相关内容