论文部分内容阅读
我们研究无序正则表达式的推断和确定性判定问题。无序操作符并不会增加正则表达式的表达能力,然而,它的引入会使语言的表达式表示指数式简洁。 本文首先研究无序模式推断问题。其本质上是一类无序正则表达式的推断问题。无序模式能够表示用之前推断算法不能揭示的有用信息。另外,最小泛化无序模式的推断是比较困难的。我们证明了寻找最小泛化无序模式是NP-hard问题。因此,我们用不同于已有推断算法的技术提出了近似算法以及一个启发式算法。实验表明,我们的启发式算法能够找到非常接近最优的结果。 然后,本文给出了一个O(|∑||E|)时间的弱确定性无序正则表达式的判定算法,其中∑是表达式中不同字符的集合。之后提出了一个O(|E|)时间内将一个无序正则表达式转化为对应的弱星号范式的算法。我们可以利用这个算法将弱确定性但非强确定性的无序正则表达式在线性时间内转化为等价的强确定性表达式。通过弱星号范式,得到了一个O(|∑||E|)时间的强确定性无序正则表达式的判定算法。就作者所知,这是针对无序正则表达式确定性的第一个解决方案。