AI MODEL DIRECTORY

Model Wiki

Googlegemini-pro

DeepSeek Chat

DeepSeek Chat model profile for capabilities, pricing and use cases

DeepSeek Chat is a large language model from DeepSeek. This entry summarizes its positioning, typical use cases, strengths, limitations and related pricing signals for quick comparison.

1000K contextInput $0.14/1M tokensOutput $0.28/1M tokensReleased December 2025

View details

DeepSeekdeepseek

DeepSeek V4 Pro

DeepSeek V4 Pro for higher-quality Chinese tasks, coding and enterprise workloads

DeepSeek V4 Pro is a DeepSeek model for higher-quality Chinese tasks, coding and enterprise workloads, often evaluated for Chinese tasks, coding and cost efficiency.

1000K contextInput ¥3/1M tokensOutput ¥6/1M tokens

View details

DeepSeekdeepseek

DeepSeek V4 Flash

Qwen Plus is a balanced model in the Qwen family, suitable for common enterprise workloads, Chinese writing, knowledge Q&A and code assistance.

1000K contextInput ¥0.8/1M tokensOutput ¥2/1M tokens

View details

Alibaba Cloud (Qwen)qwen

Qwen Max

Qwen high-capability model for advanced Chinese and coding tasks

Moonshot v1 128K for very long-document analysis, retrieval-augmented reading and complex context workflows

Moonshot v1 128K is a Moonshot/Kimi model for very long-document analysis, retrieval-augmented reading and complex context workflows, often evaluated for Chinese document and knowledge workflows.

131K contextInput ¥10/1M tokensOutput ¥30/1M tokens

View details

Moonshot (Kimi)kimi-k2

Moonshot v1 32K model profile for capabilities, pricing and use cases

GLM-4-Air for low-cost high-concurrency Chinese assistant workloads

GLM-4-Air is a Zhipu AI GLM model for low-cost high-concurrency Chinese assistant workloads, commonly evaluated for Chinese enterprise and agent workflows.

View details

Zhipu AIglm

GLM-4-Flash

GLM-4-Flash for fast responses, lightweight automation and high-frequency conversations

GLM-4-Flash is a Zhipu AI GLM model for fast responses, lightweight automation and high-frequency conversations, commonly evaluated for Chinese enterprise and agent workflows.

View details

Zhipu AIglm-4.5

GLM-4.5

GLM-4.5 for agent workflows, coding and complex reasoning tasks

GLM-4.5 is a Zhipu AI GLM model for agent workflows, coding and complex reasoning tasks, commonly evaluated for Chinese enterprise and agent workflows.

131K contextInput $0.6/1M tokensOutput $2.2/1M tokens

View details

Zhipu AIglm-z1

GLM-4 model profile for capabilities, pricing and use cases

MiniMax M3 for coding, agent workflows and complex production tasks

MiniMax M3 is a MiniMax model for coding, agent workflows and complex production tasks, often evaluated for Chinese assistants, generation and multimedia workflows.

1000K contextMultimodalInput $0.3/1M tokensOutput $1.2/1M tokens

View details

MiniMaxabab

abab7-chat

abab7-chat model profile for capabilities, pricing and use cases

abab7-chat is a large language model from MiniMax. This entry summarizes its positioning, typical use cases, strengths, limitations and related pricing signals for quick comparison.

View details

Step 2 Mini

Step 2 Mini for low-latency and cost-sensitive high-volume workloads

Step 2 Mini is a StepFun model for low-latency and cost-sensitive high-volume workloads, commonly evaluated for Chinese assistants, document and multimodal workflows.

Input ¥1/1M tokensOutput ¥2/1M tokens

View details

StepFunstep-vision

Step 1V 8K

Step 1V 8K for visual Q&A, multimodal analysis and image-text understanding

Step 1V 8K is a StepFun model for visual Q&A, multimodal analysis and image-text understanding, commonly evaluated for Chinese assistants, document and multimodal workflows.

MultimodalInput ¥5/1M tokensOutput ¥20/1M tokens

View details

StepFunstep-3

Step 3.7 Flash

Step 3.7 Flash for efficient reasoning, complex Chinese tasks and production assistants

Step 3.7 Flash is a StepFun model for efficient reasoning, complex Chinese tasks and production assistants, commonly evaluated for Chinese assistants, document and multimodal workflows.

MultimodalInput ¥1.35/1M tokensOutput ¥8.1/1M tokens

View details

StepFunstep

Step-1 8K

Step-1 8K model profile for capabilities, pricing and use cases

Step-1 8K is a large language model from StepFun. This entry summarizes its positioning, typical use cases, strengths, limitations and related pricing signals for quick comparison.

Input ¥5/1M tokensOutput ¥20/1M tokens

View details

StepFunstep

Step-2 16K

Step-2 16K model profile for capabilities, pricing and use cases

Step-2 16K is a large language model from StepFun. This entry summarizes its positioning, typical use cases, strengths, limitations and related pricing signals for quick comparison.

Doubao Seed 1.6 for general chat, reasoning and agent workflow evaluation

Doubao Seed 1.6 is a Volcengine Doubao model for general chat, reasoning and agent workflow evaluation, often evaluated for Chinese enterprise and multimodal workflows.

Input ¥0.8/1M tokensOutput ¥2/1M tokens

View details

Volcenginedoubao-thinking

Doubao Seed 1.6 Thinking

Doubao Seed 1.6 Thinking for complex reasoning, multi-step analysis and coding assistance

Doubao Seed 1.6 Thinking is a Volcengine Doubao model for complex reasoning, multi-step analysis and coding assistance, often evaluated for Chinese enterprise and multimodal workflows.

View details

Volcenginedoubao-vision

Doubao Vision Pro

Doubao Vision Pro for image-text analysis, multimodal Q&A and visual content understanding

Doubao Vision Pro is a Volcengine Doubao model for image-text analysis, multimodal Q&A and visual content understanding, often evaluated for Chinese enterprise and multimodal workflows.

View details

Volcenginedoubao

Doubao Pro 32K

Doubao Pro 32K model profile for capabilities, pricing and use cases

Doubao Pro 32K is a large language model from Volcengine. This entry summarizes its positioning, typical use cases, strengths, limitations and related pricing signals for quick comparison.

Input ¥0.8/1M tokensOutput ¥2/1M tokens

View details

domainBaidu (ERNIE)6 models

Baidu (ERNIE)ernie

ERNIE 4.0 Turbo 8K

ERNIE 4.0 Turbo 8K for Chinese understanding, content generation and enterprise applications

ERNIE 4.0 Turbo 8K is a Baidu ERNIE/Qianfan model for Chinese understanding, content generation and enterprise applications, commonly evaluated for Chinese enterprise workloads.

View details

Baidu (ERNIE)ernie-4.5

ERNIE 4.5 Turbo

ERNIE 4.5 Turbo for multi-scenario Chinese tasks, knowledge Q&A and business assistants

ERNIE 4.5 Turbo is a Baidu ERNIE/Qianfan model for multi-scenario Chinese tasks, knowledge Q&A and business assistants, commonly evaluated for Chinese enterprise workloads.

Input ¥0.8/per_thousand_tokensOutput ¥3.2/per_thousand_tokens

View details

Baidu (ERNIE)ernie-x1

ERNIE X1

ERNIE X1 for complex analysis, logical reasoning and multi-step problem solving

ERNIE X1 is a Baidu ERNIE/Qianfan model for complex analysis, logical reasoning and multi-step problem solving, commonly evaluated for Chinese enterprise workloads.

View details

Baidu (ERNIE)ernie-speed

ERNIE Speed

ERNIE Speed for low-latency conversations and high-frequency basic text tasks

ERNIE Speed is a Baidu ERNIE/Qianfan model for low-latency conversations and high-frequency basic text tasks, commonly evaluated for Chinese enterprise workloads.

View details

Baidu (ERNIE)ernie-lite

ERNIE Lite

ERNIE Lite for cost-sensitive Q&A, summarization and content generation

ERNIE Lite is a Baidu ERNIE/Qianfan model for cost-sensitive Q&A, summarization and content generation, commonly evaluated for Chinese enterprise workloads.

View details

Baidu (ERNIE)ernie

Mistral Medium 3 is a mistral-medium model from Mistral for assistants, generation and automation tasks

Mistral Medium 3 is a large language model from Mistral, with an approximate context window of 131,072 tokens. It can be evaluated for assistants, knowledge Q&A, content generation, structured extraction and business automation. Pricing and availability may vary by upstream provider or relay service.

Released May 2025

View details