上截图前我们先确定一下分析的方法:首先分成两大类即citation和quotation,因为citation有些复杂所以先说quotation,再一点点的测试citation。以某论文里的一处quotation为例,并佐以Turnitin的分析:
这段quotation已经被Turnitin检测到,然后是Turnitin给出的理由:

我们可以发现Turnitin是很神奇的啊,他仿佛就是所有大学生的essay云啊,可以猜测Turnitin应该也是基于大数据挖掘的某种东西。
以下是他判定的相似率。

其实还是要强调一点,Turnitin检测的是相似度不是抄袭度,所以我们还应该以一个平常心去面对。
接下来是分析citation了,相信这才是题主最关心的,于是我们做个试验将刚才的quotation改成citation。
1.首先我们改变句子的语序和主被动看看能否被检测出来,先上图
接着是Turnitin走流程的提供的分析。

为了检测动词是不是至关重要的被检测相似度的依据我们来换个词代替flow并将此句子变成被动,但意思可能就变了,唉答主英语水平有限....
总结一下就是,Turnitin检测相似度的原理显然不同于所谓的中文字数的重复检测原理,Turnitin检测的是句子在语法上的逻辑,这与单词是否重复是没有关系的,只要你使用了不同的逻辑来表达相同的话就算你重复的单词再多也是不会被检测出来的。