aboutsummaryrefslogtreecommitdiff
path: root/tests/StemmerTest.php
blob: 2d2db9339da23e2bffb44344cb04e710935ff82e (plain) (blame)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
<?php
/**
 * This file is part of the RussianStemmer package
 *
 * (c) Alexander Kiryukhin
 *
 * For the full copyright and license information, please view the LICENSE
 * file that was distributed with this source code
 */

namespace NXP;

class StemmerTest extends \PHPUnit_Framework_TestCase
{
    public function testStemming()
    {
        $stemmer   = new Stemmer();
        $testWords = [
            'результаты'   => 'результат',
            'в'            => 'в',
            'вавиловка'    => 'вавиловк',
            'вагнера'      => 'вагнер',
            'вагон'        => 'вагон',
            'вагона'       => 'вагон',
            'вагоне'       => 'вагон',
            'вагонов'      => 'вагон',
            'вагоном'      => 'вагон',
            'вагоны'       => 'вагон',
            'важная'       => 'важн',
            'важнее'       => 'важн',
            'важнейшие'    => 'важн',
            'важнейшими'   => 'важн',
            'важничал'     => 'важнича',
            'важно'        => 'важн',
            'важного'      => 'важн',
            'важное'       => 'важн',
            'важной'       => 'важн',
            'важном'       => 'важн',
            'важному'      => 'важн',
            'важности'     => 'важност',
            'важностию'    => 'важност',
            'важность'     => 'важност',
            'важностью'    => 'важност',
            'важную'       => 'важн',
            'важны'        => 'важн',
            'важные'       => 'важн',
            'важный'       => 'важн',
            'важным'       => 'важн',
            'важных'       => 'важн',
            'вазах'        => 'ваз',
            'вазы'         => 'ваз',
            'вакса'        => 'вакс',
            'вакханка'     => 'вакханк',
            'вал'          => 'вал',
            'валандался'   => 'валанда',
            'валентина'    => 'валентин',
            'валериановых' => 'валерианов',
            'валерию'      => 'валер',
            'валетами'     => 'валет',
            'вали'         => 'вал',
            'валил'        => 'вал',
            'валился'      => 'вал',
            'валится'      => 'вал',
            'валов'        => 'вал',
            'вальдшнепа'   => 'вальдшнеп',
            'вальс'        => 'вальс',
            'вальса'       => 'вальс',
            'вальсе'       => 'вальс',
            'вальсишку'    => 'вальсишк',
            'вальтера'     => 'вальтер',
            'валяется'     => 'валя',
            'валялась'     => 'валя',
            'валялись'     => 'валя',
            'валялось'     => 'валя',
            'валялся'      => 'валя',
            'валять'       => 'валя',
            'валяются'     => 'валя',
            'вам'          => 'вам',
            'вами'         => 'вам',
        ];
        foreach ($testWords as $word => $base) {
            $this->assertEquals($base, $stemmer->getWordBase($word));
        }
    }
}