Локальное развёртывание · Инженерная перспектива · Избегайте обходных путей

Devstral 2 · Руководство по локальному развёртыванию

Эта страница делает одно дело: запускает Devstral кратчайшим путём, и даёт вам понять 'какую модель выбрать, какое оборудование подготовить'

Перед началом (Сначала сэкономьте время)

Предложение

Сначала проверьте рекомендации по оборудованию, чтобы определить, хотите ли вы запускать 24B или 123B; проблемы, связанные с именованием/псевдонимами, объединены вFAQ。

Ollama (Самый простой)

Одна команда для запуска

ollama run devstral-2

Адрес библиотеки моделей: https://ollama.com/library/devstral-2

Когда подходит Ollama?

Вы хотите быстро проверить 'нравится ли вам'
Вы больше заботитесь о 'одной команде для запуска сервиса', чем об ultimate настройке производительности
Вы уже продвигаете рабочий процесс Ollama в своей команде

GGUF / llama.cpp (Общинный стандарт)

Рекомендуемый процесс (копируйте как есть на основе вашей копии)

Скачать квантизированную модель GGUF с Hugging Face
Использовать llama.cpp / LM Studio / text-generation-webui
Настроить потоки/размер пакета/окно контекста в соответствии с проектом

Рекомендуемые параметры (для начала)

Temperature: 0.15
Context: 128k–256k

Примечание: Это не 'единственный правильный ответ', просто более стабильное значение по умолчанию

Devstral 2 · Руководство по локальному развёртыванию

Перед началом (Сначала сэкономьте время)

Рекомендации по оборудованию (Сначала не тратьте время)

Ollama (Самый простой)

GGUF / llama.cpp (Общинный стандарт)