作者:杨金珊 审校:陈之炎 本文约3500字,建议阅读7分钟 大会内容包括人工智能和自动化、大数据和基础设施、机器学习和深度学习、数据可视化、数据分析、医疗保健和物联网、商业实践和数据安全。
2022年12月18日,由国际数据与工程协会(IDEAS)主办的2022全球人工智能大会在加州洛杉矶会展中心(Los Angeles Convention Center)圆满落下帷幕。大会为期两天,来自人工智能、数据科学以及区块链领域的三十名技术专家、学者、投资人在大会发表了演讲,内容涵盖了Web 3.0、元宇宙、人脸识别、电子支付等前沿技术,同时涉及了人工智能生态体系内的法律、经济、投资、孵化等内容,给与会观众带来一场高水平的信息和知识分享大会。
IDEAS是国际数据工程与科学协会,全球人工智能大会的一个学习平台,旨在连接人工智能和数据科学爱好者,展示尖端技术,并邀请人工智能和数据科学专家讨论各种各样的主题,包括行业趋势、数据科学应用、开源软件、机器学习等等。
本次大会设有多个主题演讲和专题讨论,内容包括人工智能和自动化、大数据和基础设施、机器学习和深度学习、数据可视化、数据分析、医疗保健和物联网、商业实践和数据安全。涉及包括医疗保健、金融科技、零售、媒体、制造、保险、教育、电子商务在内的多个行业。参会的演讲嘉宾均为来自IBM、英特尔、Capital One、洛杉矶市、加州理工学院、阿里巴巴、埃森哲人工智能的业界领袖。
2022 IDEAS AI会议议题
1. CONVERSATIONAL AI: BEYOND STOCHASTIC PARROTS(对话式人工智能:超越随机鹦鹉)
A. 关键差异:
B. 统计模型有什么好处?
苹果: Siri
亚马逊: Alexa
谷歌: Duplex
特斯拉: FSD
OpenAI: DALL-E, Whisper
C . ChatGPT
商务会话的要求:
准确快速的学习
可扫描操作
基于知识图的认知
聊天框与Brian是认知架构。
2. DEMYSTIFYING DATA SCIENCE CAREER PATHS (揭开数据科学职业道路的神秘面纱)
A. 数据科学工作流程
问题陈述→数据收集→数据准备→建模/再培训→演示→部署→反馈回路……
B. 数据科学家技能
概率:统计、机器学习、优化编程
CS基础
货架工具箱的可视化
业务和领域知识
大数据云计算
Python, R, SQL, OOP, Matplotlib, Seaborn, Plotly, Tablequ, Power BI, Spark, Fink/Kafka, Airflow, Sagemaker, AzureML
C. 免费的学习数据源
Kaggle
KDnuggets
UCI Machine Learning
Data.gov
Dataset Search
3. SELF SERVICE METADATA CONFIG DRIVEN DATA LOAD AND COMPUTATIONAL PLATFORM(自服务元数据配置驱动数据加载和计算平台)
框架配备了解析和处理所有数据格式,如JSON, AVRO, Parquet和CSV
用户可以选择现有的连接器支持不同的源和目标系统,如Kafka, Cassandra和SQL
元数据存储系统和应用程序特定的资源配置,以优化资源分配
与自定义udf捆绑的抽象层,为用户提供灵活的查询系统,如Kafka和Cassandra与SQL
4. ARCHITECT YOUR AI PLATFORM WITH OPTIMIZED DATA PIPELINE(用优化的数据管道构建ai平台)
Speaker: Bin Fan(ALLUXIO)
数据编排可以提供帮助
统一的名称空间提供了单一的访问点,并消除了数据湖中的竖井。
案例研究:Bilibili,简化数据访问,提高训练效率和模型准确性。
MOMO: MOMO在多个Alluxio集群中运行数千个Alluxia节点,管理超过100+ TB的数据进行搜索和训练。
Web2 vs Web3: Web3的推文将是不可审查的,因为控制是分散的。Web2推特可以审查任何账户或推文
5. HOW WEB3 IS POISED TO FIX THE ”MISTAKES” OF WEB2.0(web3将如何修正web2.0的“错误”)
A.Web 2.0
与HREFS连接的静态页面,
没有轮廓,没有移动的元素,不能相互作用,直接用帖子…
迷恋“错过的联系”
电子商务桌面浏览器Access的萌芽。
少数实体创造了大量内容
社交网络,移动优先,云驱动计算
B. Web3.0
语义网、人工智能……
我们可以在同一层次上交流
内部数据存储—低级别
SSI是一套转移数字身份控制的技术从第三方身份提供者直接到个人。
身份颁发者、身份持有人和身份验证者
SSI的关键特征持久:组织和连接事物也需要它们,可以使用相同的基础设施,点对点,而不是客户机-服务器。
零知识证明(ZKP):个人可识别信息(PII)
不需要中央机构的许可。
DataEarns。
6. TOKEN ECONOMY: NEW BUSINESS MODELS IN WEB3(代币经济:web3的新商业模式)
Web 3.0,也被称为“语义Web”,是一个概念,指的是下一代万维网,其中网络更加智能和互联。它的理念是创建一个更容易被计算机理解和处理的数据网络,使它们能够执行更高级的任务,并做出更明智的决定。
语义Web有望更加去中心化,数据和信息以分布式的方式存储,而不是集中在几个服务器上。这使得网络更加健壮、更富有弹性,能为用户提供更好的隐私和安全保障。
Web 3.0的一些主要特性包括:
利用人工智能和机器学习使网络更加智能,以更有意义的方式理解和解释数据。
使用关联数据和语义技术来创建一个更容易被计算机理解和处理的相互关联的信息网络。
虚拟现实和增强现实技术的集成,创造更具沉浸感和互动性的在线体验。
使用区块链技术来创建一个更安全、去中心化的网络。
用什么来消费?
比特币:去中心化和中心化系统的更好结合
NFT:是一种数字资产,代表唯一项目或资产的所有权。NFT基于区块链技术,该技术允许以安全透明的方式以数字方式存储、跟踪和传输。
NFT被用来表示广泛的资产,包括艺术品、收藏品、音乐,甚至虚拟房地产。由于NFT是唯一的且不可替代的,因此它们可用于验证和证明物品的所有权和真实性。
NFT的主要特征之一是它们是不可替换的,这意味着它们不能与另一个相同价值的物品交换或替换。这与可替换资产形成了鲜明对比,比如货币,它可以兑换其他同等价值的物品。
7. BLOCKCHAIN DEVELOPMENTS IN FINANCIAL SERVICES(区块链在金融服务业的发展)
Speaker: Marvin Bantugan (Zventus)
抵押贷款行业的主要统计数据
美国抵押贷款行业4,338家金融机构单一家庭住宅抵押贷款市场13.2万亿美元抵押贷款支持证券(MBS)余额9.5万亿美元2021年抵押贷款债务总额18万亿美元美国第三季度GDP为25.66万亿美元
8. LEGAL CONSIDERATIONS FOR LAUNCHING YOUR BLOCKCHAIN, NFT, OR CRYPTO PROJECT(启动区块链,NFT或加密项目时需要考虑的法律考虑素)
Speaker: habeeb syed
A. Chuck E. Cheese:
之前没有市场的代币(Kickstarter)
之前没有市场的代币
具有初始效用而没有市场的代币
具有初始效用的代币
完全建成后没有市场的代币
完全建立市场后的代币
B. FinCEN
AML和KYC:有些风险可能是不可避免的,但你至少可以让自己免于牢狱之灾
货币服务业务
分类——管理者vs交换者vs用户并不意味着你不能继续做证券(Ripple)这对非美国发行人是如何运作的?
C. NFTs (Cont 'd)
他们是否愚蠢且毫无意义?
数码产品
D.区块链科技公司
参会心得
笔者有幸参加了2022 IDEAS AI会议,个人对参与本次会议后的心得体会总结如下:
1. 人工智能
人工智能(AI)是指机器或计算机系统执行通常需要人类智能水平的任务的能力,例如模式识别、决策或从数据中学习。人工智能有许多不同的方法,例如机器学习和基于规则的系统,系统从数据中学习来提高其性能,系统行为通过明确编程来实现。
人工智能可应用于包括医疗保健、金融和零售在内的多个领域。例如,人工智能可用于分析医学图像,以检测异常情况或识别欺诈性金融交易;还可用于改善客户服务,让聊天机器人帮助客户并回答他们的问题;在交通运输领域,人工智能可用于开发自动驾驶汽车或卡车,它们可以感知周围环境,并根据这些信息做出决定。
2. 大数据
大数据是指可以通过分析来揭示超大数据集的模式、趋势和关联,特别是针对那些与人类行为和交互有关的数据集。大数据可以用于商业、科学和政府等各个领域,利用大数据分析做出更明智的决策并改进各种流程。
大数据在医疗保健领域可用于分析大量患者数据,以改善患者的治疗结果。例如,利用来自电子健康记录的数据确定可能表明特定治疗对某些类型的患者更有效的趋势和模式;大数据也被用于营销领域,分析客户数据,识别模式和趋势,为营销活动提供信息。
3. 数据科学
数据科学是一个涉及使用统计和计算技术从数据中提取见解和知识的领域。数据科学家经常使用大型数据集,并使用各种工具和技术(如机器学习)来分析和解释数据。
数据科学用于分析来自社交媒体平台的数据,以了解用户行为并确定趋势;在金融领域,数据科学被用来分析市场数据,以便做出更明智的投资决策;在体育领域,数据科学被用于分析表现数据,以提高训练和表现。
4. Web3
Web3指的是第三代万维网,旨在通过实现更智能和去中心化的应用程序来改进当前网络的功能。Web3技术包括区块链技术,利用区块链技术创建安全和透明的分散网络,以及分布式计算,它允许在计算机网络上分布数据和计算。
Web3技术可用于创建在区块链网络上运行的去中心化应用程序(dApps),这些dapp可用于创建安全透明的记录保存系统,如供应链管理或投票系统;Web3技术还被用于创建去中心化金融(DeFi)平台,使金融交易无需传统中介。
5. 区块链:
区块链是一个分布式数据库,允许创建安全和透明的事务记录。它由一个计算机网络组成,多台计算机协同工作来验证和记录交易,交易记录存储在区块中,并以区块链的形式连接在一起。区块链通过安全保存透明的交易记录从而减少了对中介机构的需求,有可能彻底改变各个行业。
区块链被用于创建安全和透明的供应链管理系统,允许跟踪货物在供应链中的移动;区块链也被用于创建去中心化的投票平台,这有助于确保选举的完整性;在金融行业,区块链被用来创建安全透明的平台,用于进行金融交易,如买卖证券。
数据派研究部介绍
数据派研究部成立于2017年初,以兴趣为核心划分多个组别,各组既遵循研究部整体的知识分享和实践项目规划,又各具特色:
算法模型组:积极组队参加kaggle等比赛,原创手把手教系列文章;
调研分析组:通过专访等方式调研大数据的应用,探索数据产品之美;
系统平台组:追踪大数据&人工智能系统平台技术前沿,对话专家;
自然语言处理组:重于实践,积极参加比赛及策划各类文本分析项目;
制造业大数据组:秉工业强国之梦,产学研政结合,挖掘数据价值;
数据可视化组:将信息与艺术融合,探索数据之美,学用可视化讲故事;
网络爬虫组:爬取网络信息,配合其他各组开发创意项目。
点击文末“阅读原文”,报名数据派研究部志愿者,总有一组适合你~
转载须知
如需转载,请在开篇显著位置注明作者和出处(转自:数据派THUID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。
未经许可的转载以及改编者,我们将依法追究其法律责任。