<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>Inference on RuleMaker</title>
        <link>http://rulemaker.cn:80/categories/inference/</link>
        <description>Recent content in Inference on RuleMaker</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>en-us</language>
        <lastBuildDate>Tue, 08 Oct 2024 00:00:00 +0000</lastBuildDate><atom:link href="http://rulemaker.cn:80/categories/inference/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>机器学习推理平台</title>
        <link>http://rulemaker.cn:80/p/inference_platform/</link>
        <pubDate>Tue, 08 Oct 2024 00:00:00 +0000</pubDate>
        
        <guid>http://rulemaker.cn:80/p/inference_platform/</guid>
        <description>&lt;p&gt;本文主要介绍各公司机器学习推理平台的架构设计以及优化措施。
包括CPU和GPU等异构计算的优化。&lt;/p&gt;
&lt;h2 id=&#34;ebay&#34;&gt;eBay
&lt;/h2&gt;&lt;p&gt;eBay机器学习推理平台。eBay关于在线推理平台从在线特征到在线预估打分的一系列文章系统地讲解了机器学习推理平台的设计。&lt;/p&gt;
&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://mp.weixin.qq.com/s?__biz=MzA3MDMyNDUzOQ==&amp;amp;mid=2650517067&amp;amp;idx=1&amp;amp;sn=b520e05c7e2a8093c16cc37540e4f2c7&amp;amp;chksm=8731961fb0461f09e6fac864b0d0c45bd7f67d1a68bb9ba748784698f80cd0701b8793da89ae&amp;amp;cur_album_id=2271456078435680258&amp;amp;scene=190#rd&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;“亿”想天开AI｜eBay 云原生人工智能推理平台：推理智能，推演“亿”生&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://mp.weixin.qq.com/s?__biz=MzA3MDMyNDUzOQ==&amp;amp;mid=2650514671&amp;amp;idx=1&amp;amp;sn=4119a94507f6adbd3dbbb4d8fd60271e&amp;amp;chksm=87319cbbb04615ade78597d3fe406b811eb9fcb2d91b8b0f2558769d6a05206b70b9137c53b3&amp;amp;cur_album_id=2271456078435680258&amp;amp;scene=190#rd&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;“亿”论 AI ｜统一在线特征服务&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://mp.weixin.qq.com/s?__biz=MzA3MDMyNDUzOQ==&amp;amp;mid=2650514591&amp;amp;idx=1&amp;amp;sn=6d07bceaeb9d2e7970327ff7e19d343f&amp;amp;chksm=87319ccbb04615ddb99a163d208060b17b7914e804a01b23548d019a44360baadfdb8f7faef2&amp;amp;cur_album_id=2271456078435680258&amp;amp;scene=190#rd&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;“亿”论AI｜基于中心化元数据及配置驱动的eBay AI特征工程管理平台&lt;/a&gt;&lt;/p&gt;
&lt;h2 id=&#34;百度&#34;&gt;百度
&lt;/h2&gt;&lt;p&gt;百度机器学习推理平台。&lt;/p&gt;
&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://zhuanlan.zhihu.com/p/592328723&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;云原生 AI 的资源调度和 AI 工作流引擎设计分享&lt;/a&gt;&lt;/p&gt;
&lt;h2 id=&#34;小红书&#34;&gt;小红书
&lt;/h2&gt;&lt;p&gt;小红书机器学习推理平台。&lt;/p&gt;
&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://zhuanlan.zhihu.com/p/630418545&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;让算力不再成为瓶颈，小红书机器学习异构硬件推理优化之道&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://zhuanlan.zhihu.com/p/669185508&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;集群 CPU 利用率均值达 45% ，揭秘小红书规模化混部技术实践&lt;/a&gt;&lt;/p&gt;
&lt;h2 id=&#34;阿里&#34;&gt;阿里
&lt;/h2&gt;&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://zhuanlan.zhihu.com/p/448858199&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;广告深度学习计算：异构硬件加速实践&lt;/a&gt;&lt;/p&gt;
&lt;h2 id=&#34;哔哩哔哩&#34;&gt;哔哩哔哩
&lt;/h2&gt;&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://zhuanlan.zhihu.com/p/699390555&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;GPU集合通信库在B站的应用和改进&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://mp.weixin.qq.com/s?__biz=Mzg3Njc0NTgwMg==&amp;amp;mid=2247498055&amp;amp;idx=1&amp;amp;sn=74cde1c88a24d13de34164f1185dc321&amp;amp;chksm=cf2f3c62f858b574d9c4e11da035b53133a01ee727b8e8900783088f6a0ea3c9bd73f10f2282&amp;amp;cur_album_id=2989251302771638276&amp;amp;scene=190#rd&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;浅谈B站效果广告在线推理服务的性能优化&lt;/a&gt;&lt;/p&gt;
&lt;h2 id=&#34;腾讯&#34;&gt;腾讯
&lt;/h2&gt;&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://zhuanlan.zhihu.com/p/5747020695&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;新一代超级计算框架Ray在微信AI计算中的大规模实践&lt;/a&gt;&lt;/p&gt;
</description>
        </item>
        
    </channel>
</rss>
