OpenAI CLIP 关键点 - 连接图像和文字-世界消息_律速网

首页 > 综合 >

OpenAI CLIP 关键点 - 连接图像和文字-世界消息

2023-05-07 11:28:19 来源：博客园

(相关资料图)

标签： #CLIP #Image2Text #Text2Image #OpenAI
创建时间：2023-04-21 00:17:52

基本原理

CLIP是一个图像分类模型。
准备训练数据：准备大量的文本描述和图片的训练对，然后把进行对比训练。
文本描述和图片的训练对的数据获取：从互联网上获得400Million的图像文本数据对。这个规模大致和GPT-2的数据规模相当。1. 好处1：数据获取容易。传统的做法会对图像进行分类，以ImageNet为例，获得图片后需要人工进行分类标注，这个周期长成本高。2. 好处2：迁移能力强。过去是精确分类一张图片，这样当出现一个未包含的图片的时候，在已知图片分类里就找不到对应的答案了。而CLIP因为训练的素材里面的描述是文本性的（而不是一两个单词的简单分类名称），因此它获得了更好的泛化能力。
因为有了这么大的数据，所以需要更好大量的算力，以及优质的算法。
1. Text Encoder采用的是Transformer。
2. Image Encoder采用的是Vision Transformer。
3. 整个计算在256个V100 GPU上训练2周（12天），得出了ViT-L/14@336px模型。
CLIP的设计初衷是为了能够做到零样本迁移（Zero-Shot）到下游数据集上的，也就是说，希望训练完的模型，在遇到一个完全没有见过的图片训练集的时候，可以进行高效的分类。为了达到这个零样本学习的能力：
1. 研发人员摒弃了传统的数据集，因为传统的数据集通常是建立在明确分类基础上的，所以当一个新分类的图片出现的时候，这个模型就不知所措了。
2. 把一般的分类换成一个描述性的文本，则可以比较好的解决这个问题。这里列出了他们准备文本描述的模板，通过这些模板，可以把一个带有歧义的单词，变成一个有意义的图像描述，比如论文里举例：boxer，当只提到这个词的时候，我们可能以为它是个拳击手，但是当结合了模板A photo of a {label}, a type of pet.（其中{label}替换成boxer）那么boxer就可以被理解为一种狗（其中在生成数据的时候，比如a type of pet部分也是可以自动拼进去的，比如图片本来就来自牛津词典宠物图片集，那么自然就可以增加这样的分类信息，这会进一步让图像识别变得更加精准）。
主要用途：图像搜索（基于文本）、自然语言描述图像等。
限制：参考论文P18（6. Limitations）
结果：CLIP在Zero-Shot的情况下，在大部分常见数据集上都比特定训练的模型表现的好。在一些特别的模型基础上，Zero-Shot可能不一定有很好的效果，但是进行Few-shot则比特定训练的模型表现要好，因此模型具备很强的迁移能力。
引发的思考：
1. 数据量大，就可以获得不一样的研究方法和模型效果。其实CLIP用到的方法并不新鲜，前人也有用过类似的方法，但是因为没有采用这么大的数据量，所以没有达到SOTA的效果。
2. 模型的输入输出都变成了token，也可以理解都都是文本，它和NLP领域的GPT模型带来的颠覆性相似。
3. 因为是一般性的文本描述，而不是特定分类描述，所以模型具备了多模态的特性。
4. 因为是一般性的文本描述，所以模型可以用于自然语言描述图像。
这个项目的训练方法没有开源，但是训练结果的模型开源了。

基于CLIP延展的项目

StyleCLIP：变化发型、眼睛等。
CLIPDraw ：CLIPDraw: Exploring Text-to-Drawing Synthesis through Language-Image Encoders 可以通过CLIP绘制一些蜡笔画。
Paper：Open-Vocabulary Object Detection Using Captions 基于字幕的开放词汇目标检测目标检测。
Contrastive Language-Image Forensic Search 基于文本对视频中的内容进行检索。

参考资料

Paper: Learning Transferable Visual Models From Natural Language Supervision 从自然语言监督中学习可迁移的视觉模型
1. CLIP 论文逐段精读【论文精读】
OpenAI | CLIP: Connecting text and imagesCLIP：连接文本和图像

转载请注明出处：https://www.cnblogs.com/volnet/p/openai-clip.html

标签：

延伸阅读：

OpenAI CLIP 关键点 - 连接图像和文字-世界消息

标签： CLIP Image2Text Text2Image OpenAI创建时间：2023-04-2...
中国商业联合会：5月份中国零售业景气指数持续回升_环球热讯

5月6日，中国商业联合会发布5月份中国零售业景气指数为51 1%，较上...
头条：信用卡贷款买车的流程和特点都有哪些

信用卡贷款买车日趋流行，这种购车方式满足了很多年轻人提前买车的...
即时焦点：商标侵权打假重要的步骤是什么

商标侵权打假重要的步骤是什么商标侵权打假很重要的就是制作投诉书...
热消息：天津注册公司流程及费用2022

我们知道很多人出来社会有一定的资本会选择自己创业，这样的话就可...
热点聚焦：教师猝死可认定工伤的情形有哪些

一、教师猝死可认定工伤的情形有哪些1、教师在工作时间和工作岗位，...

更多婚姻法相关法律知识

最近更新

OpenAI CLIP 关键点 - 连接图像和文字-世界消息

标签： CLIP Image2Text Text2Image OpenAI创建时间：2023-04-2...

2023-05-07
财产权包括哪些类别天天热推荐

一、财产权包括哪些类别财产权包括物权与债权两大类。1、物权物权是...

2023-05-07
今日观点!对方原因没签成合同怎么办

对方原因没签成合同怎么办缔约过失责任，又称先契约责任，有的学者...

2023-05-07
破产和解的提出时间有什么规定

破产和解的提出时间有什么规定由于提出破产和解是企业的自主行为，...

2023-05-07
天天微头条丨信用卡逾期了去找谁谈(信用卡逾期了去找谁谈话)

展开全部逾期处理不了。除非是银行的责任那样你可以申请消除。或者...

2023-05-07
信用卡利息100利息(信用卡利息100利息多少钱)|当前要闻

信用卡支取现金都是按照每天万分之五的利息收取的，而且是利滚利的...

2023-05-07
中国商业联合会：5月份中国零售业景气指数持续回升_环球热讯

5月6日，中国商业联合会发布5月份中国零售业景气指数为51 1%，较上...

2023-05-07
头条：信用卡贷款买车的流程和特点都有哪些

信用卡贷款买车日趋流行，这种购车方式满足了很多年轻人提前买车的...

2023-05-07
即时焦点：商标侵权打假重要的步骤是什么

商标侵权打假重要的步骤是什么商标侵权打假很重要的就是制作投诉书...

2023-05-07
热消息：天津注册公司流程及费用2022

我们知道很多人出来社会有一定的资本会选择自己创业，这样的话就可...

2023-05-07
热点聚焦：教师猝死可认定工伤的情形有哪些

一、教师猝死可认定工伤的情形有哪些1、教师在工作时间和工作岗位，...

2023-05-07
全球今日讯！新乡某某担保集团出事了

新乡某某担保集团出事了近日，传出河南新乡某某投资担保集团出事了...

2023-05-07
妻子不同意离婚时应该怎么办

妻子不同意离婚时应该怎么办夫妻双方就离婚协商不成或一方不同意离...

2023-05-07
音乐作品版权怎么申请

音乐作品版权怎么申请依据《作品自愿登记试行办法》的规定，音乐作...

2023-05-07
世界快播：近亲结婚指的是什么

一、近亲结婚是指什么近亲结婚，是指三代以内有共同的祖先，如果他...

2023-05-07
领结婚证都需要带哪些证件

马上就要去领结婚证的新人赶紧看过来，看看领结婚证需要带什么证件...

2023-05-07
全球热资讯！航空公司退票法律规定是什么

航空公司退票法律规定是什么《中国民用航空旅客、行李国内运输规则...

2023-05-07
成都市房产管理局电话、地址一览表

对于成都市房产管理局电话、地址一览表的内容，最近很多人很困惑，...

2023-05-07
世界即时看！法医鉴定轻伤标准是什么2022

一、法医鉴定轻伤标准是什么法医轻伤鉴定标准是物理、化学及生物等...

2023-05-07
导游违规获资格证,低龄导游违法吗-每日快讯

近日网上总曝光各旅游地区天价消费事件，导游资质不规范以及素质不...

2023-05-07
如何办理公司执照

企业在运营过程中，需要每年进行检验审核，以便更好的促进企业运营...

2023-05-07
承兑汇票和汇票的区别|要闻速递

承兑汇票和汇票的区别从票据的效力来看，银行汇票和银行承兑汇票都...

2023-05-07
当前时讯：公司注册地与经营地不一致,怎么办

公司注册地和实际经营地不一致的法律风险主要有：1、经工商行政管理...

2023-05-07
百事通！学生欠债百万跳楼,校园贷款合法吗

学生因为欠下校园贷款百万，因此跳楼那这样的校园贷款是否合法？接...

2023-05-07
积分落户社保分值是如何计算加分|全球头条

积分入户是我国推出的一种人才吸引政策，而积分入户需要的条件是比...

2023-05-07
没有工作的情况下申请贷款的方法有哪些

没有固定的工作，只要能证明自己有还贷能力，一般情况是可以申请住...

2023-05-07
2019国庆节高速路免费几天

现在基本是家家户户都有了自己的小轿车，所以现在很多人都会在节假...

2023-05-07
焦点速讯：不计免赔险是什么意思？

个人在购买车辆之后，应按照国家的规定购买交强险，交强险是强制缴...

2023-05-07
适用缓刑的条件有哪些？

一、适用缓刑的条件有哪些？(1)犯罪分子被判处拘役或者3年以下有期...

2023-05-07
劳动者向劳动局投诉的流程是什么全球今日报

劳动局投诉流程步骤：准备证明材料、协商调解、投诉举报仲裁;材料：...

2023-05-07

15037178970

保险法

物权与债权的优先顺序怎么划分？物权包括哪些权利？

一、怎么区分债权和物权区别债权与物权的方式：1 物权与债权反映不...

2023-05-06
中华人民共和国个人所得税法第二条内容工资个人所得税计算方法是什么呢？

工资所需要缴纳的个人所得税，等于个人的应纳税所得额乘以个人所得...

2023-05-06
身份证有效期一般是多长时间？中华人民共和国身份证法第五条内容是什么？

身份证有效期：十六周岁至二十五周岁的，身份证有效期为十年，二十...

2023-05-06
临时工工资标准是怎样的？劳动合同法第六十八条内容是什么？

临时工的工资标准：每小时的计酬标准不得低于用人单位所在地人民政...

2023-05-06
有关转让专利使用权怎么进行？专利使用权转让以后有什么事情需要注意？

转让专利使用权怎么进行?专利转让是指专利权人作为转让方，将其发明...

2023-05-06

更多

热门问答

单纯的遗产赠要缴税吗？

2023-05-05
遗产继承必须要公证吗？

2023-05-05
继承遗产的份额怎么分配？

2023-05-05
父母过世后如何办理房产过户？

2023-05-05
房屋遗产可以直接买吗？

2023-05-05
取保候审已经过期现在让海关拘留这是什么情况？

2023-05-04
到德国交了保证金留学但是孩子的精神方面有问题保证金可以拿回来吗？

2023-05-04
我想问一下申请护照需要带什么证件？

2023-05-04
您好：请问从国外进口的费钢税率是多少？非常感谢！

2023-05-04
外国旅游签证可以在中国大使馆登记结婚吗？

2023-05-04
我可以在苏州申请护照吗？我所在的地方是云南

2023-05-04
你好我想问一下外国人来这里工作没有护照该怎么办？

2023-05-04
如何续签居住证我的1月7日到期

2023-05-04
中介说商务签转工作签证合法吗应该向哪个国家机关报案？

2023-05-04
你好我需要申请去美国结婚的签证过程是什么？

2023-05-04
代理权的产生原因是什么？当我国没有外贸经营权的企业委托外贸公司进出口贸易时，相关当事人的权利和责任是什么？

2023-05-04

更多

房产纠纷

离职后住房公积金怎么办？离职后五险一金怎么办？

离职后五险一金怎么办?一、离职后养老保险怎么办?离职后，养老保险...

医疗事故

什么时候应当确定债权人申报债权的期限？

什么时候应当确定债权人申报债权的期限？
什么是固定资产盘亏？盘亏固定资产的规定有哪些？

什么是固定资产盘亏？盘亏固定资产的规定有哪些？
网上申请失业金领取流程是怎么样的？失业人员符合哪些条件可以领取失业保险金？

网上申请失业金领取流程是怎么样的？失业人员符合哪些条件可以领取失业保险金？
受托代理资产核算内容有哪些？受托代理业务的概念是什么？

受托代理资产核算内容有哪些？受托代理业务的概念是什么？
专利有哪些授予条件？专利授予需要具有哪些特性？

专利有哪些授予条件？专利授予需要具有哪些特性？
房产继承有遗产税吗中国实行遗产税了吗？

房产继承有遗产税吗中国实行遗产税了吗？
模拟法庭是什么?民事开庭程序有哪些步骤?

模拟法庭是什么?民事开庭程序有哪些步骤?
退婚可以不退彩礼吗？离婚彩礼不能要回来的情况有哪些？

退婚可以不退彩礼吗？离婚彩礼不能要回来的情况有哪些？
个人工资收入是夫妻共同财产吗事实夫妻财产如何分配？

个人工资收入是夫妻共同财产吗事实夫妻财产如何分配？
哪种情况下离婚不分财产？男方有婚外情离婚财产怎么分？

哪种情况下离婚不分财产？男方有婚外情离婚财产怎么分？

Copyright©2004-2022 lvsu.com版权所有豫ICP备2021032478号-37 联系我们：897 18 09@qq.com

顶部