Оставьте имя и Telegram — остальное обсудим. Без брифов на 40 слайдов и звонков по три раза.
Research, гайды, новости и анонсы. Пишем о том, что сами проверили на железе и под нагрузкой.
Поиск по статьям, новостям, гайдам…↵Реальные цифры: 85-95 tok/s при p95 450мс на Llama-70B. Разбираем, где кончается инженерия и начинается карго-культ при выборе сервинга для on-prem LLM.