diff options
| author | 2026-04-03 15:40:30 +0300 | |
|---|---|---|
| committer | 2026-04-03 15:40:30 +0300 | |
| commit | ff79efd13b537d714dfacf74d72e84331eca39a3 (patch) | |
| tree | f6bd2cac5a34eb5011282dc82d04fcd44e016ab5 /content/posts/2026-03-21-aiserver | |
| parent | upd theme (diff) | |
| download | blog-master.tar.gz blog-master.tar.bz2 blog-master.tar.xz blog-master.zip | |
Diffstat (limited to '')
| -rw-r--r-- | content/posts/2026-03-21-aiserver/index.md | 74 | ||||
| -rw-r--r-- | content/posts/2026-03-21-aiserver/qwen35.png | bin | 0 -> 308845 bytes | |||
| -rw-r--r-- | content/posts/2026-03-21-aiserver/qwen35_small.jpg | bin | 0 -> 66325 bytes | |||
| -rw-r--r-- | content/posts/2026-03-21-aiserver/steamdeck.jpg | bin | 0 -> 8593665 bytes | |||
| -rw-r--r-- | content/posts/2026-03-21-aiserver/steamdeck_small.jpg | bin | 0 -> 58002 bytes |
5 files changed, 74 insertions, 0 deletions
diff --git a/content/posts/2026-03-21-aiserver/index.md b/content/posts/2026-03-21-aiserver/index.md new file mode 100644 index 0000000..c7c8f7c --- /dev/null +++ b/content/posts/2026-03-21-aiserver/index.md @@ -0,0 +1,74 @@ +--- +title: Свой ИИ сервер на Steam Deck +date: 2026-03-21T13:06:20+03:00 +tags: + - ИИ +category: + - ИИ +--- + +Я весьма активно в последнее время экспериментирую с нейронками, причём не +только в контексте их обычного использования для коддинга. Больше меня +интересует как раз разработка *под* нейронки (автономные агенты, ага). + +Так же сейчас перепрохожу по учебникам в свободное время институтский курс по +линейке (а на очереди ещё вычмат, тервер и матан...) чтобы восстановить свои и +так слабые знания по математике, необходимой для ИИ. Затем план уже конкретно в +МЛ, БЯМ и прочеее вгрызться. Внезапно математика, когда ей занимаешься не «из +под палки» потому что зачёт/экзамен, а только для себя — становится **очень** +интересной. Прям жалею что в институте недооценивал. Но сейчас всё же не об +этом речь. + +Сейчас про именно разработку под уже существующие БЯМ. + +Конечно, в процессе разработки и особенно тестирования, т.н. токенов тратится +не много, а ОЧЕНЬ много. И, честно говоря, мне жалко бабки на это. И это ещё не +говоря о том, что появляется зависимость от неких «облачных провайдеров», что я +очень и очень не приемлю. + +Выход — локальный инференс БЯМ. Благо, совсем недавно китайская Alibaba +обрадовала сообщество своим новым семейством моделей Qwen3.5 которые +одновременно и достаточно компактные для локального инференса (даже на CPU!) и +при этом достаточно умненькие (серьёзно, она решает ту шуточую задачу с кружкой +у которой запаян верх и отрезано дно :) ). + +Т.к. я не сторонник стационарных компьютеров уже лет так 20 — адекватного ПК с +видеокартами у меня нет и не предвидится. Даже если бы я накопил на мощную +видюху для нейронок — мне было бы некуда её пихать! Но тут я вспомнил, что у +меня простаивает такое чудо технологий, как Steam Deck! + + + +Лонг стори шорт. На родной SteamOS поднять не получилось, поэтому я просто +поставил на стимдек свою любимую AltLinux p11. Удивительно, но она встала с +полпинка, без всякого пердолинга драйверов. Хотя я был готов, что что-то пойдёт +не так, ибо железо у деки весьма кастомное. + +Пробовал Ollama с qwen3.5:9b (unsloth/Qwen3.5-9B-GGUF) — как бы работала, но +через сколько-то запросов помирала. Непорядок совсем. Долго пытался это +отдебажить, но так и не получилось ни подружить деку с rocm ни заставить +стабильно олламу работать с vulkan. + +В общем, плюнул на олламу и поставил +llama.cpp. И вот уже на ней, квенка завелась как родная! Да, скорость инференса +7-8 токенов в секунду, но для моих целей это вполне и вполне достаточно! На CPU +ноута в 10 потоков (12 ядерный i7 13 поколения) хорошо если 1 токен в секунду +был, при том что остальная ОС была в коматозном состоянии. + +Пробовал ещё и более вкусную qwen3.5 a3b MOE — но она не влезла в память +¯\\\_(ツ)_/¯ + + + +Да, аж 10 минут. Но там долгий ризонинг был. Обычно в моих задачах ризонинг +сильно короче. + +Итог, у меня наконец-то есть своя локальная «бесплатная» и достаточно +продвинутая моделька, у которой я могу под эксперименты жрать токены +миллионами. Но всё равно, начинаю копить на полноценный GPU сервер, чтобы +играться уже с совсем большими БЯМ. Хочу что-то из серии Nvidia DGX Spark или, +что вероятнее, минипк на Ryzen AI Max+ 395 + Radeon 8060S. Я вообще считаю, что +за подобными персональными минисерверами для ИИ будущее. + +Мечта — иметь локальный инференс MiniMax M2.7 и GLM5 :) Ну а пока, имею то, что +имею. diff --git a/content/posts/2026-03-21-aiserver/qwen35.png b/content/posts/2026-03-21-aiserver/qwen35.png Binary files differnew file mode 100644 index 0000000..8af7a29 --- /dev/null +++ b/content/posts/2026-03-21-aiserver/qwen35.png diff --git a/content/posts/2026-03-21-aiserver/qwen35_small.jpg b/content/posts/2026-03-21-aiserver/qwen35_small.jpg Binary files differnew file mode 100644 index 0000000..3322391 --- /dev/null +++ b/content/posts/2026-03-21-aiserver/qwen35_small.jpg diff --git a/content/posts/2026-03-21-aiserver/steamdeck.jpg b/content/posts/2026-03-21-aiserver/steamdeck.jpg Binary files differnew file mode 100644 index 0000000..277aee2 --- /dev/null +++ b/content/posts/2026-03-21-aiserver/steamdeck.jpg diff --git a/content/posts/2026-03-21-aiserver/steamdeck_small.jpg b/content/posts/2026-03-21-aiserver/steamdeck_small.jpg Binary files differnew file mode 100644 index 0000000..109c60a --- /dev/null +++ b/content/posts/2026-03-21-aiserver/steamdeck_small.jpg |
