【Hacker News搬运】Shazam的工作原理(2003)[pdf]
-
Title: How Shazam Works (2003) [pdf]
Shazam的工作原理(2003)[pdf]
Text:
Url: https://ismir2003.ismir.net/presentations/Wang.pdf
### 公司简介 Shazam Entertainment 是一家成立于2000年的公司,总部位于伦敦。该公司的服务于2002年8月启动,目前在英国、德国和芬兰等地提供服务,并计划扩展到欧洲和亚洲的其他国家。 ### 产品介绍 Shazam的主要产品是一个通过移动电话查询音乐的服务。用户可以通过拨打特定号码(2580)让手机聆听音乐,然后Shazam会发送短信回执,包含歌曲名称和艺术家信息,这一过程称为“标签化”。用户还可以通过访问http://www.shazam.com获取更多内容,如铃声、歌曲邮件等。 ### 目标用户 Shazam针对的核心用户群体是18-25岁的音乐手机用户,他们通常难以跟上最新的音乐发布,并且喜欢新技术。此外,还有26-40岁的用户群体,他们能够识别经典 hits 以及新音乐,并需要购买建议。还有14-17岁的早期青年用户,他们能够迅速识别下一个购买的歌曲,并享受实用服务。 ### 功能特色 Shazam允许用户随时随地通过移动电话识别音乐。该服务在各种环境下都有效,例如在车里、家里、工作中,以及电影院、俱乐部、酒吧、咖啡馆、商店和餐馆等地。 ### 技术挑战 Shazam面临的主要技术挑战包括音频源材料的缺陷、音频设备的限制、环境因素以及搜索算法的约束。为了克服这些挑战,Shazam采用了独特的方法来创建音乐的“指纹”,并确保该系统具有高度的噪声抵抗性和可扩展性。 ### 未来展望 Shazam的技术不仅可以用于音乐识别,还可以应用于其他领域,如广播监控、广告跟踪、P2P文件共享监控、图书馆音乐识别、同步和校准、音频谷歌(以例子查询)等。 ### 结论 Shazam提供了一种非符号化、非泛化的“精确匹配”服务,具有很高的噪声抵抗性和高度可扩展性,且速度非常快。 请注意,由于原始内容不是中文,以上信息是根据提供的英文内容进行翻译和总结的。
Post by: goranmoomin
Comments:
aragonite: also see:
<a href="https://www.ee.columbia.edu/~dpwe/papers/Wang03-shazam.pdf" rel="nofollow">https://www.ee.columbia.edu/~dpwe/papers/Wang03-shazam.pdf</a> (2003)aragonite: 另请参阅:<a href=“https://;/;www.ee.columbia.edu/!~dpwe/:论文/,Wang03 shazam.pdf”rel=“nofollow”>https:///;www.ee.columbia.edu/~dpwe;纸张;Wang03 shazam.pdf</a>(2003)
NoPicklez: Such impressive engineering behind it. I remember using Shazam for the first time and thought it was an absolute game changer. I still use it through Siri to identify songs I hear out in the wild.<p>Didn't realise it existed all the way back to 2003, which makes it all the more impressive
NoPicklez: 它背后的工程设计令人印象深刻。我记得第一次使用Shazam,我认为它绝对改变了游戏规则。我仍然通过Siri使用它来识别我在野外听到的歌曲<p> 没有;我没有意识到它早在2003年就存在了,这让它更加令人印象深刻
jldugger: So fundamentally just a ton of locality sensitive hashing, cleverly chosen to match the domain. Still wild that they shipped this in the flipphone era.
jldugger: 因此,从根本上讲,只需要大量的位置敏感哈希,巧妙地选择来匹配域。仍然疯狂的是,他们在翻盖时代推出了这个。
impish9208: I wonder if it can be expanded to things like speeches, snippets of movies/TV shows, etc.
impish9208: 我想知道它是否可以扩展到演讲、电影片段等内容;电视节目等。
xcdzvyn: Related: <a href="https://news.ycombinator.com/item?id=32530056">https://news.ycombinator.com/item?id=32530056</a> "Source code example of the Shazam algorithm" et. al.
xcdzvyn: 相关:<a href=“https://;/;news.ycombinator.com/!item?id=32530056”>https:///;news.ycombinator.com/;项目id=32530056</a>“;Shazam算法的源代码示例“;等