Tiktokenizer - hao123上网导航

Tiktokenizer官网

Tiktokenizer是一个计算给定大模型提示词的tokens数量的开源项目，最初的功能主要功能是帮助用户计算OpenAI计费规则中每次请求所用的tokens数量（不包括返回的tokens），现在已经扩展了近几十个大模型。

Tiktokenizer官网入口地址：https://tiktokenizer.vercel.app/
Tiktokenizer开源项目地址：https://github.com/dqbd/tiktokenizer/

目前支持下列模型：

Popular

cl100k_base
o200k_base
gpt-4-1106-preview
gpt-3.5-turbo
codellama/CodeLlama-7b-hf

Open-Source Models

codellama/CodeLlama-70b-hf
meta-llama/Meta-Llama-3-8B
meta-llama/Meta-Llama-3-70B
microsoft/phi-2
google/gemma-7b
deepseek-ai/DeepSeek-R1
Qwen/Qwen2.5-72B
tiiuae/falcon-7b
01-ai/Yi-6B

OpenAI Encodings

gpt2
r50k_base
p50k_base
p50k_edit

OpenAI Models

gpt-4o
gpt-4
gpt-4-32k
text-davinci-003
text-davinci-002
text-davinci-001
text-curie-001
text-babbage-001
text-ada-001
davinci
curie
babbage
ada
code-davinci-002
code-davinci-001
code-cushman-002
code-cushman-001
davinci-codex
cushman-codex
text-davinci-edit-001
code-davinci-edit-001
text-similarity-davinci-001
text-similarity-curie-001
text-similarity-babbage-001
text-similarity-ada-001
text-search-davinci-doc-001
text-search-curie-doc-001
text-search-babbage-doc-001
text-search-ada-doc-001
code-search-babbage-code-001
code-search-ada-code-001
text-embedding-ada-002
text-embedding-3-small
text-embedding-3-large

数据统计

相关导航

SmolVLM-500M-Instruct

SmolVLM-500M 是由 Hugging Face 开发的轻量级多模态模型，属于 SmolVLM 系列。该模型基于 Idefics3 架构，专注于高效的图像和文本处理任务。它能够接受任意顺序的图像和文本输入，生成文本输出，适用于图像描述、视觉问答等任务。其轻量级架构使其能够在资源受限的设备上运行，同时保持强大的多模态任务性能。该模型采用 Apache 2.0 许可证，支持开源和灵活的使用场景。