同义词论文的研究(精选8篇)

时间:2024-04-17 15:46:14 admin 火文秘

同义词论文的研究 第1篇

近年来,许多研究证实了同义词替换在降低论文重复率方面的有效性。通过使用同义词替换软件,如小发猫伪原创或小狗伪原创等,可以自动识别和替换文本中的重复词汇,从而降低论文的相似度。这些软件能够大大提高替换的效率和准确性,有助于降低论文的查重率。

随着自然语言处理技术的发展,语义理解在同义词替换中发挥着越来越重要的作用。现有的同义词替换软件开始注重语义理解,通过训练大规模的语料库和深度学习模型,能够自动学习和识别词汇的语义和上下文信息。这种语义理解的应用有助于更准确地替换同义词,保持文本的连贯性和可读性。

不同领域和文化的词汇差异较大,因此跨领域和跨文化的同义词替换成为研究热点。现有的同义词替换软件也开始考虑不同领域和文化的词汇差异,以提高替换的准确性和适用性。这种跨领域的同义词替换研究有助于更好地适应不同领域和文化的论文写作需求。

随着技术的不断发展,同义词替换的自动化和智能化程度不断提高。现有的同义词替换软件能够自动识别和替换文本中的重复词汇,大大提高了替换的效率和准确性。同时,深度学习等人工智能技术的应用也推动了同义词替换技术的智能化发展,未来有望实现更加智能化的同义词替换方法。

同义词论文的研究 第2篇

同义词研究早期,学界对意义和同义词的认识尚不深入,往往简单地将同义词界定为意义相同或相近的词,但未指明“意义”是什么,哪部分意义必须相同,哪部分可以不同。如,王了一说同义词是“意义相同”的词。高名凯引用苏联学者阿布拉摩维契的定义说:“同义词就是意义相近的词”。

洪梦湘、孙良明、张志毅、孙玄常、北京师范大学中文系编写组、杨书忠、苏蚩、葛本仪等表述略有不同,但均是如此界定。有些界定还额外考虑了语音因素,如北京大学中国语言文学系语言学教研室“同义词就是声音不同而意义相同或相近的词”。

有的语义学论著界定同义词也采取了这种简单化的做法。如,EvelynHatch、CherylBrown说同义词是含有相同意义的词(S)。说同义词是语音不同而意义相同或非常相近的词(Synonymsaredif-)。JohnLyons说意义相同的词语是同义的(E)。

还有的研究者借助同义义场界定同义词,如黄伯荣认为“意义相同或相近的词组成的语义场叫做同义义场,义场中的各个词叫做同义词”,其实是循环定义。

这些界定从字面对“同义词”进行说明,没有明显的漏洞和瑕疵,但传递的信息少,意义观不明,据此难以很好地将同义现象和其他相近的语言现象区分开。在此阶段之后,同义词的界定均有明确的意义观为理论背景,虽然有的意义观存在问题,但相较意义观不明的同义词界定,是很大的进步。

同义词论文的研究 第3篇

同义词替换适用于各个领域的论文。无论是自然科学、社会科学还是人文科学,同义词替换都可以有效地降低论文的重复率。通过替换重复的词汇和短语,研究者可以避免直接抄袭,提高论文的创新性和原创性。

同义词替换不仅可以降低论文的重复率,还可以提高论文的质量。通过替换不准确或陈旧的词汇,使用更加准确、新颖的同义词,可以使论文的表达更加清晰、流畅,提高论文的可读性和专业性。这对于研究者来说,有助于更好地理解自己的研究内容,提高研究的深度和广度。

同义词替换适用于各种类型的论文,包括研究报告、综述、实验报告等。无论论文的篇幅大小,同义词替换都可以有效地降低重复率,提高论文的创新性和原创性。

同义词论文的研究 第4篇

电子医疗系统(EMRs)中的临床文本具有各种各样的丰富信息,包括患者叙述、患者临床交互、疾病诊断输出等,这些信息都极其有助于未来决策。从非结构化数据里抽取知识,同义词发现【1】是个非常重要的任务,能使很多下游任务受益。举个例子,当一个医生查询“vitamin c”, 来寻找相关的临床文本,自动发现其同义词,例如“c vitamin”,”vit c”, “ascorbic acid”或者一些拼写错误,例如“viatmin c”能帮助提升检索性能。为了患者的隐私和安全,赋予医学研究机构直接访问大规模纯临床文本甚至去识别是非常困难的。因此,医学术语和它们从临床文本抽取的共现量逐步成为EMRs数据研究社区的热门方法【2】。

在这个工作里,把在临床语料里医学术语和它们的共现统计量的给定集合叫做privacy-aware临床数据,并且基于这个数据研究同义词发现。如图1所示,给定一个抽取自临床文本的词汇集合以及全域共现graph,推荐一个和查询词汇同义的列表。

本文贡献:

这篇文章的主要贡献如下三方面:

问题定义:

同义词论文的研究 第5篇

有些研究者在界定同义词时表现出了多样的意义观,其中以同时赞同指称观和概念观的居多。如,孙常叙从指称观出发界定同义词,但同文又说“有些同义词是同一概念的不同造词”。常敬宇说:“如果不是表达同一概念内具有细微差异的词,……那就不是同义词了”,但又认为“是否指同一事物对象”等是鉴别同义词的主要依据。武占坤说同义词“指称同一事物、表达同一概念”。伍铁平说“用不同的词指称相同或相近的事物,这些词的词义就有相同关系;有这样关系的一组词称为同义词。词义相同,指词义的概念内容相同。”

有的研究者界定同义词同时表现出概念观和反映观。如,张弓认为同义词的本质是“一组词中各词间(两个或更多的词)的基本意义核心意义相一致,而其补充的次要的意义附加的色采有细微的差异”,但同文又说同义词的作用在于“对同一概念的表现多样化”,同义词“一定表示同一概念的关系”。以多种意义观为理论背景界定同义词,一方面反映出研究者对意义本质的认识模棱两可;另一方面也反映了研究者们对意义和同义词本质的探索过程。

同义词论文的研究 第6篇

1.指称观下的同义词界定

词语通过指称外部世界中的事物或现象而具有意义,一个词语的意义就是它所指称的对象,这是指称观对意义的看法。以指称观作为理论背景,研究者往往将同义词界定为指称同一事物或现象的词语。如,孙常叙说同义词“表达同一对象”,并强调判断同义词“唯一的依据就是它们是不是概括同一对象”。

高庆赐认为同义词表示“同一事物的名称”、标志“同一对象”。张静认为等义的同义词代表的.“事物或现象相同”,近义的同义词不表示“同一事物或现象”,也是以指称观为理论背景。指称观的种种不合理之处遭到学界普遍批评,原因主要有两点:一是语言中的词语并非均有客观所指,抽象名词、集体名词、抽象动词、虚词等就没有具体所指。二是语言不是对客观世界的镜像反映,词语和事物并非一一对应,一个词语可以指称不同的对象,一个对象也可以用不同的词语指称。

以指称观为背景的同义词界定,早有研究者提出批评,张志毅就明确指出“同义词存在的基础,不是指称同一对象。”

2.概念观下的同义词界定

概念观认为词义对应概念。持概念观的研究者往往把同义词界定为表示同一概念的细微差异的词语或外延相同、内涵有异的词语。苏联语言学家克留耶娃以“概念同一”界定同义词的观点在20世纪五六十年代对中国学者影响很大。如,周祖谟详引克留耶娃的观点并表示赞同,说:“同义词所表示的是同一个概念之内的各种细微差别”。刘冠群引用克留耶娃的论述,说:“只有把两个归结成为一个主要的概念才能建立同义词组”。

再如,石安石认为同义词“是概念相同但词义有所不同的词”。刘叔新、张永言、张履祥、高文达、陆善采、陈满华、石安石等均从概念观出发界定同义词。符淮青用概念是否同一作为区分等义词和同义词的标准,石毓智以概念关系确定同义词的范围。概念观与指称观相比,其优点是离析出“内涵”和“外延”分别加以描写,其缺陷是将语义范畴对应于哲学范畴。词义和概念并非一一对应,很多词不表示概念,如感叹词、语气词、象声词等。以概念观为意义观的同义词界定也受到许多批评。王理嘉指出根据概念标准来确定同义词,是不是同义词就取决于各人对词义所表示的概念的理解了,而各人对概念是否相同的理解可能并不一样。

张志毅指出这样会导致“把不同词汇系统的‘同一概念’的词当做同义词。这样也就要排除词义大部分相同的这类词”。孙汝建、梅立崇等对于概念观下的同义词界定也持否定态度。

3.反映观下的同义词界定

其后,研究者们对概念观的缺点予以修正,提出概念义是理性认识的结果,是实词词义中的理性意义部分;实词词义中比相应概念多出来的部分是感性意义;虚词不表示概念但可以表示语法关系。持反映观的研究者主要从理性意义和感性意义来界定同义词。如,张志毅认为“同义词存在的基础是根本意义大部分重合”。谢文庆、刘叔新等从理性意义和感性意义的异同对同义词进行分类。梅立崇详尽阐述了从理性意义和感性意义界定同义词的原因。反映观相比概念观有所进步,对同义词的界定也从最初简单地认为同义词是“意义相同的词”到把意义对应于具体的事物现象或概念,继而回归语言意义本身,这是对意义有了更深刻认识的结果。

4.联想观下的同义词界定

刘宁生所持的观点与当时学界普遍流行的观点相比可谓独树一帜,某种程度上与当前认知语言学在语言研究中对语言使用者的重视相契合,值得分析。刘宁生对当时的同义词研究提出质疑,认为界定同义词是规定性研究,“词的同义关系本质上是由于词义的相同性所引起的一种联想关系……特定语言的同义关系以联想的方式存在于一切说这种语言的人的大脑之中。……不同的人对同一个词可能有不同的经验,所以潜在的同义词典各自有不同的解释。”

对于刘宁生的观点,我们赞同的:一是人为规定同义词是什么,没有实用价值。语言研究应当采取对语言现象如实描写的态度。二是对语言使用者而言,同义关系是一种联想关系,每个语言使用者头脑中的心理同义词典不尽相同。我们不赞同的有两点,一是认为界定同义词是规定性研究。照这样的思路,所有的下定义都成了规定性研究,但显然并非如此。对某种现象有了一定认识之后总结其特征并做出界定,以便将其与其它现象区别开来,这是人类认识世界的基本手段。

界定不是规定。二是过于强调语言使用者头脑中的联想关系。对语言使用者而言,同义关系确实是一种联想关系,研究者当然可以研究,葛本仪就曾指出:“人们都是以其对词义的掌握程度来划分词义类聚的,同时也是以此来认识同义词的,都是以自己对词义的认识为根据……每个人都可以对同义词或反义词等有自己的理解”。

同义词典有时也会考虑到实用性而收录一些语言学家并不认为同义但语言使用者分辨不清的词,如张志毅“有时为了实用,选收了近于同义的易混词。”不过,语言研究者们更感兴趣的是在语言使用者头脑中引起这种联想关系的词义的相同性。语言使用者头脑中的同义联想关系不同,但词义相同性却是客观存在的,并不因为某一个语言使用者心理词库中没有甲词的同义词乙,甲和乙在语言中的同义关系就消失了。词义相同性才是语言研究更应关注的问题。

总之,联想观下的同义词界定强调从语言个体使用者的视角研究同义词,提升了语言使用者在同义词研究中的地位,但对词义的客观性及其在同义词研究中的根本性地位重视不够。

同义词论文的研究 第7篇

随着人工智能技术的发展,同义词替换软件如小发猫伪原创、小狗伪原创等在学术界得到了广泛应用。这些软件通过自动识别和替换重复的词汇,帮助研究者降低论文的重复率。因此,从技术层面来看,同义词替换是可行的。

使用同义词替换软件可以快速、准确地完成替换操作,提高工作效率。相对于传统的手动替换方法,同义词替换软件可以大大节省时间,提高工作效率。因此,从时间和效率角度来看,同义词替换是可行的。

虽然同义词替换软件需要一定的成本投入,但相对于传统的手动替换方法来说,其成本是相对较低的。而且,通过使用同义词替换软件,研究者可以节省大量的时间和精力,提高工作效率,从而创造更多的价值。因此,从经济角度来看,同义词替换是可行的。

同义词论文的研究 第8篇

推理阶段评估:进一步评估实际应用能力,跟几个比较强的baselines相比,在所有的setting下,SurfCon方法优于所有方法(大约至少8%)。

参数敏感性:在这里评估了两个参数,平衡surface信息和context信息的,以及用来匹配的上下文术语量。初步阶段随着增大,模型性能变好,因为随着更多语义信息加入,SurfCon能探索更多的语义相似的同义词。但是随着继续增大,模型性能下降,原因是surface信息也是一个重要特征需要考虑的。一般很小时,由于考虑的全局context不够导致这个性能不好。但是在大部分setting下,增加到一定大小后,性能基本不变。

总结

这篇文章研究基于Privacy-aware临床数据上,一种新的且有实际使用价值,使用不是很敏感数据的同义词发掘框架。这个框架能很好处理InVOOV查询术语,在真实数据上,潜在优于各种各样的方法。未来这个方法可以扩展到除同义词之外更广泛的语义关系。

参考文献:

【1】 C. Wang, L. Cao, and B. Zhou. 2015. Medical synonym extraction with concept

space models. In IJCAI.

【2】A. L. Beam, B. Kompa, I. Fried, N. P. Palmer, X. Shi, T. Cai, and I. S. Kohane. 2018. Clinical Concept Embeddings Learned from Massive Sources of Medical Data. arXiv preprint arXiv: (2018).

【3】Z. Yang, W. W. Cohen, and R. Salakhutdinov. 2016. Revisiting semi-supervised

learning with graph embeddings. In ICML.

【4】

Open Health Data, clinical concept prevalence and co-occurrence from electronic

health records. Scientific data 5 (2018), 180273.

【5】Z. Cao, T. Qin, T. Liu, M. Tsai, and H. Li. 2007. Learning to rank: from pairwise approach to listwise approach. In ICML.

【6】H. J. Lowe, T. A. Ferris, P. M. Hernandez, and S. C. Weber. 2009. STRIDE–An

integrated standards-based translational research informatics platform. In AMIA.