第一节 专利检索基础
“数字版权保护技术专利数据资源采集项目”专利检索范围为1994年1月1日至2017年12月31日向“九国两组织”提交申请的专利,所有数据均为官方数据。项目以德温特数据库(Derwent Innovation,DI)等商业数据库为基础,通过专利检索准备、检索策略制定、检索结果获取和检索信息筛选等检索流程,对上述时间和地域范围内的专利进行检索,获取相应的基础数据。
一 检索流程
本项目检索流程包括专利检索准备、检索策略制定、检索结果获取和检索信息筛选。
(一)专利检索准备
检索前准备是专利检索程序后续各步骤的基础,主要包括确认检索需求、进行技术和法律调研、选择专利检索数据库等。有效的专利检索准备会为之后的专利检索过程和结果分析奠定坚实的基础。
1.需求确认
在检索前的准备工作中,本项目通过专题讨论和专家研讨等形式明确检索需求,明确每次检索的主题和期望得到的结果,并对相关需求的背景和目的进行细化和解析,以便确定检索范围和检索目标。
2.技术调研
技术调研常用方式有书面或口头的技术沟通,以及阅读相关技术文献等。技术调研的范围主要包括技术领域、技术现状、技术发展和技术方案。技术调研的目的在于将检索事项划分为多个适于检索和分析的技术主题,为制定检索策略做准备。
3.专利检索数据库选择
选择专利检索数据库应考虑检索的类型、检索的时间范围和区域范围等因素。专利检索数据库的选择需考虑区域国别、申请/授权、有效/失效、发明/实用新型/外观设计、全文/摘要、公用/商用等方面。同时,还要考虑数据库本身的检索字段、浏览和下载等功能设置情况,以便后续检索过程的顺利进行。
(二)检索策略制定
检索策略制定是专利检索过程中非常重要的一个环节,即在分析检索提问的基础上,确定检索的数据库和检索用词,明确检索词之间的逻辑关系并科学安排查找步骤[1]。检索策略是否恰当和全面,直接影响检索结果的准确性和全面性。
1.检索要素确定
确定检索要素是制定检索策略的基础。一般来说,确定检索要素时需要考虑技术领域、技术问题、技术手段和技术效果等方面,而专利检索的要素包括关键词和分类号等。其中,关键词为该技术领域中常见的词汇,关键词的各式组合能较为准确地涵盖该领域的专利内容;专利中的分类号多数使用国际专利分类(International Patent Classification,IPC)系统,是目前国际通用的专利文献分类和检索系统,可以为技术领域的限定提供一定帮助。
2.检索要素表达
检索要素确定后就可以进行检索要素表达。检索要素表达通常包括两种:一种为关键词表达,一种为分类号表达。本书中每个技术主题都有相应的检索要素,均采用关键词表达和(或)分类号表达的检索要素表达方式,在此不针对每一技术主题进行赘述。
3.检索式构建
在检索要素表达的基础上,需要利用逻辑运算符将多个检索要素组配在一起构建检索式。专利检索数据库中,常用的逻辑运算符包括:AND、OR和NOT。其中,“AND”表示的关系是所检索的两个关键词都存在的记录;“OR”表示的关系是所检索的两个关键词至少存在其中一个的记录;“NOT”表示的关系是应排除在外的检索要素。
(三)检索结果获取
专利检索实施过程中,首先需要进行尝试性检索,然后大致浏览检索结果,补充可能的关键词和分类号,对之前制定的检索策略进一步修正和完善。检索过程中还要考察检索结果的查全率和查准率等情况,采用多维度补充检索(如重点竞争对手、文献信息等)、多人背靠背检索(避免个人误差对检索结果造成影响)、多库校验(多个商业数据库检索数据相互补充,避免单一数据库的数据收录范围局限性对检索结果造成影响)等方式,以获得最终检索结果信息。
(四)检索信息筛选
在筛选检索信息的过程中,首先需要明确筛选准则,本书采用的筛选准则是寻找特定技术领域与待检索技术主题相关的专利文献。
在确定筛选准则后,则是具体的筛选流程。第一步,初筛。对检索获得的专利文献进行初步阅读和去噪,阅读内容包括标题、摘要、权利要求、说明书和附图。第二步,结果确认及意见阐述。由专利检索技术人员对初筛结果进行确认并提出相关意见。第三步,筛选和标引。通过反复沟通确定筛选的标引准则,根据标引准则做进一步的筛选和标引。通过上述三个步骤便可完成专利筛选工作。
二 本项目专利检索的范围
(一)区域范围
本项目专利检索的区域范围为“九国两组织”。“九国两组织”具体为:中国(CN)、澳大利亚(AU)、德国(DE)、法国(FR)、英国(GB)、日本(JP)、俄罗斯(RU)、美国(US)和韩国(KR)9个国家,以及欧洲专利局(EP)和世界知识产权组织(WO)2个国际组织。其中中国仅限于大陆地区,不包括中国香港、澳门以及台湾地区,世界知识产权组织只接收国际专利申请,因此,其相关数据表中仅有专利申请量,而无专利授权数量。
(二)时间范围
本项目专利检索的时间范围开始于1994年1月1日,截止于2017年12月31日。
三 本项目专利检索的数据来源
本项目专利检索以科睿唯安的德温特数据库为主,辅之以律商联讯公司的TotalPatent和知识产权出版社CNIPR数据库,对检索式的构建及检索结果的确认进行交叉验证。相关数据在性质上均为官方数据。其中,德温特数据库包含世界各地50家专利授予机构的增值专利信息,收录6000多万个专利和近3000万个同族专利。此外,该数据库中的专利还拥有经技术专家改写的标题和摘要等有利于用户阅读的人工改写信息。TotalPatent可访问100个国家及国际组织所公布的专利文献,其中包括31个国家的全文数据,相关的专利信息每日更新,具有时效性高的特点。CNIPR数据库综合国内外先进专利检索系统的优点,针对英文专利开发了机器翻译模块,以帮助用户理解专利内容,方便用户检索。
同时,为了充分了解各检索主题所涉及的技术,并对其进行相应的技术脉络梳理,在项目执行过程中,本项目还大量地使用了CNKI数据库对相关文献进行查阅。
需要说明的是,由于专利从申请到公开再到相关数据库收录有一定时间的延迟,故本书各项技术主题专利检索结果中的近两年数据有可能小于实际数据。其中,2017年的数据有可能大幅小于实际数据,2016年的数据有可能小幅小于实际数据,相关专利检索数据和结论仅供参考。