belun.app Блог EN

Счётчик символов онлайн: зачем нужен и как правильно считать

Практическое руководство по подсчёту символов для соцсетей, SEO, SMS и кода — с советами по лимитам платформ и различиям в правилах подсчёта.

Typing on a keyboard — counting characters for social media and SEO

Знакомая ситуация: вставляете подпись в Instagram, нажимаете «Опубликовать» — и текст обрывается на полуслове из-за превышения лимита. Или отправляете SMS, а оно разбивается на два сообщения вместо одного и обходится вдвое дороже. Подсчёт символов кажется мелочью ровно до тех пор, пока не подводит — потому что каждая платформа считает по-своему, и различия не всегда очевидны.

Лимиты символов по платформам

Twitter / X ограничивает публикацию 280 символами, считая каждый символ Unicode, включая пробелы. Ссылки нормализуются до 23 символов независимо от реальной длины. Эмодзи в современных клиентах считаются как один символ.

С SMS интереснее. По умолчанию используется кодировка GSM-7, которая даёт 160 символов на одно сообщение. Стоит добавить символ вне этого набора — большинство букв с диакритикой, «умные» кавычки или эмодзи — и сообщение переключается на UCS-2 с лимитом 70 символов на сегмент. Одно эмодзи в 140-символьном тексте превращает его в двухчастное сообщение.

Instagram допускает до 2 200 символов в подписи, но видно лишь около 125 — до ссылки «ещё». Главную мысль лучше выносить в самое начало, иначе она просто не прочитается.

LinkedIn ограничивает посты 3 000 символами, обновления страниц компаний — 700 символами.

Тег title для SEO лучше держать до 60 символов, чтобы он полностью отображался в результатах Google. Meta description — до 160: более длинные обрезаются с многоточием, что плохо смотрится в выдаче.

С пробелами или без — какой счётчик использовать?

Большинство платформ социальных сетей считают символы с пробелами. SMS и некоторые азиатские платформы — без. Если сомневаетесь, проверьте документацию платформы. Или просто отслеживайте оба показателя одновременно.

Наш Счётчик символов всегда показывает оба значения рядом.

Буквы и общее количество символов

Иногда нужно отделить буквы от пунктуации, цифр и пробелов — для политик паролей, языковых задачек или правил валидации. Подсчёт букв использует категорию Unicode \p{L}, которая корректно распознаёт буквы любого алфавита: латиницу, кириллицу, арабский, китайский и другие.

Подсчёт строк и слов

Количество строк важно для сообщений git-коммитов (большинство стайл-гайдов рекомендует заголовок до 50–72 символов, тело с переносом строк на 72 символах), инструментов code review и многострочных полей форм с явными ограничениями.

Подсчёт слов и символов дополняют друг друга при проверке читаемости. Введение блог-поста из 500 слов занимает примерно 2 800–3 200 символов с пробелами — зная оба показателя, можно быстро оценить объём контента.

Частые ошибки

Путаница байтов и символов. Некоторые столбцы баз данных имеют ограничение по байтам, а не по символам. Один символ кириллицы занимает 2 байта в UTF-8, иероглиф — 3 байта. Если вы обрезаете ввод пользователя на стороне базы данных, считайте байты в бэкенде, а не символы в браузере.

«Умные» кавычки и тире из Word или Google Docs. Фигурные кавычки и длинное тире (—) — отдельные символы Unicode, которые могут вести себя иначе в системах, рассчитанных на ASCII. Если скопированный текст не проходит проверку символов — скорее всего, дело в этом.

Переносы строк. Символ переноса строки считается как один символ. В Windows окончание строки — два символа (\r\n), что может удивить при сравнении счётчиков на разных системах.

Как пользоваться инструментом

Счётчик символов работает полностью в браузере — без сервера, без загрузки файлов, без регистрации. Вставьте текст, и все счётчики обновятся мгновенно: символы, символы без пробелов, буквы, цифры, слова и строки. Удобно для быстрой проверки перед публикацией или для отслеживания показателей в процессе написания.

Попробуйте инструмент

Счётчик символов →