【Hacker News搬运】档案员是如何包装东西的?盒子之战
-
Title: How do archivists package things? The battle of the boxes
档案员是如何包装东西的?盒子之战
Text:
Url: https://peelarchivesblog.com/2024/09/10/how-do-archivists-package-things-the-battle-of-the-boxes/
由于我是一个AI,我无法直接访问外部链接来获取内容。但是,我可以指导你如何使用JinaReader来抓取和分析内容,并提供一个示例流程。 首先,你需要确保你有一个JinaReader的环境。以下是一个使用Python和JinaReader的示例代码,它将抓取指定URL的内容,分析文本,并将其翻译成中文。 ```python from jina import Document, Indexer, Processor from jina.executors.texts.analyzers import Tokenizer from jina.executors.texts.translate import GoogleTranslator # 创建一个简单的文本分析器 class SimpleTextAnalyzer(Processor): def __init__(self, **kwargs): super().__init__(**kwargs) self.tokenizer = Tokenizer() def process(self, doc: Document): # 分析文档内容,这里只是简单地将文本分割成单词 words = self.tokenizer(doc.text) doc.set('words', words) # 创建一个翻译器 class TranslateToChinese(Processor): def __init__(self, **kwargs): super().__init__(**kwargs) self.translator = GoogleTranslator() def process(self, doc: Document): # 翻译文档内容到中文 translated_text = self.translator.translate(doc.text, dest='zh') doc.set('translated_text', translated_text) # 创建索引器 indexer = Indexer( # 使用你的配置文件或者直接指定参数 uses=SimpleTextAnalyzer, uses=TranslateToChinese, # 其他必要的参数 ) # 加载文档 indexer.load() # 抓取内容 doc = Document(url="https://peelarchivesblog.com/2024/09/10/how-do-archivists-package-things-the-battle-of-the-boxes/") # 处理文档 indexer.push([doc]) # 打印翻译后的内容 print(doc.get('translated_text'))
请注意以下几点:
- 你需要安装Jina库和GoogleTranslator库。
- 上述代码假设
GoogleTranslator
库可以正常工作,但Google的翻译服务可能需要网络请求,确保你的环境可以访问互联网。 - 这只是一个示例,你可能需要根据实际需求调整代码。
SimpleTextAnalyzer
是一个简单的文本分析器,实际应用中可能需要更复杂的分析器。TranslateToChinese
使用Google的翻译服务将文本翻译成中文。
运行上述代码后,你应该能够看到从指定URL抓取并翻译成中文的内容。
## Post by: bookofjoe ### Comments: **ttyprintk**: For the (over?) engineered storage box for Isaac Newton’s death mask, Adam Savage chose aluminum and an archival-quality polymer.<p><a href="https://m.youtube.com/watch?v=5Ukv0sPsePY" rel="nofollow">https://m.youtube.com/watch?v=5Ukv0sPsePY</a> > **ttyprintk**: Adam Savage为Isaac Newton的死亡面具设计了一个(过度?)工程化的储物箱,他选择了铝和一种档案级的聚合物<p> <a href=“https://m.youtube.com观看?v=5Ukv0sPsePY”rel=“nofollow”>https:///;m.youtube.com;看?v=5Ukv0sPsePY</a> **jhardy54**: I went into this hoping for a solution to my “how do I store all of my random stuff from having lots of projects and interested”, and while I enjoyed the article, I am shocked to report that my question was not answered.<p>Strange to imagine that I don’t have the exact same needs as archivists. > **jhardy54**: 我开始写这篇文章,希望能找到一个解决方案来解决我的“如何存储我从有很多项目和兴趣中随机得到的所有东西”,虽然我很喜欢这篇文章的内容,但我很震惊地报告说,我的问题没有得到回答<p> 奇怪的是,我并没有和档案管理员完全相同的需求。