أداة مفتوحة المصدر • 18 مايو 2026 • • —

Semble: أداة بحث ذكي في الأكواد تقلل استهلاك التوكنات 98% – دليل تركيب وتشغيل

📑 محتويات المقال

Reference OS v85 دقائق قراءة١٨ مايو ٢٠٢٦informational

Semble: أداة بحث ذكي في الأكواد تقلل استهلاك التوكنات 98% – دليل تركيب وتشغيل

بعد قراءة هذا الدليل، ستتمكن من تثبيت وتشغيل Semble على مشروعك الخاص وتقليل استهلاك التوكنات بنسبة 98% مقارنة بـ grep.

الخلاصة: Semble هي أداة بحث دلالي مفتوحة المصدر تقلل استهلاك التوكنات بنسبة 98% مقارنة بـ grep. تعمل على CPU فقط، وتتطلب Python 3.8+ وLinux/macOS. التركيب يتضمن استنساخ المستودع، تثبيت الاعتماديات، بناء الفهرس، وتشغيل الخادم. يمكن دمجها مع Claude Code عبر أداة مخصصة.

أداة Semble للبحث في الأكواد613 كلمة تقريباًزارو — مكتبة الأدلة العملية

LIVE PROJECTMinishLab/semble★ 0

Show HN: Semble – Code search for agents that uses 98% fewer tokens than grep

رابط المشروع على GitHub ↗

MAP

خريطة الصفحة

اختر القسم الذي تحتاجه الآن

ما هو Semble؟
من يحتاج Semble؟
المتطلبات الأساسية
تركيب Semble خطوة بخطوة (نتائج اختبار فعلية)
شرح ملف .env (وهمي)
تشغيل Semble وتجربة البحث
اختبار أداء Semble على مشروع حقيقي
كيفية دمج Semble مع Claude Code
أخطاء شائعة وحلولها
بدائل Semble
أسئلة شائعة

قبل أن تطبق

الفكرة التي تمنع التسرع

فاتورة توكنات Claude Code الشهرية تتجاوز 500 دولار؟ قد يكون Semble الحل.

أسئلة التشخيص السريع

قبل أن تطبق، اعرف أين تقف بالضبط

هل مشروعك يحتوي على أكثر من 5000 ملف؟
هل تستخدم وكلاء AI مثل Claude Code وتدفع فواتير توكنات عالية؟
هل تبحث عن بديل مجاني لـ grep يقلل استهلاك التوكنات؟
هل تعمل على Linux أو macOS؟
هل لديك Python 3.8+ مثبت؟
هل تفضل أداة لا تحتاج GPU أو API keys خارجية؟
هل جربت grep أو ripgrep ووجدتها مكلفة من حيث التوكنات؟

نظام التشغيل: Input → Process → Output

INPUT

استعلام بحث نصي (مثل اسم دالة أو وصف)

PROCESS

1. تحويل الاستعلام إلى embedding باستخدام نموذج potion-code-16M. 2. البحث في الفهرس باستخدام BM25. 3. دمج النتائج باستخدام RRF. 4. إعادة ترتيب النتائج بإشارات خاصة بالكود.

OUTPUT

قائمة بملفات ومواقع الكود ذات الصلة مرتبة حسب الأهمية

Decision Layer

اختيار بين embeddings وBM25 حسب نوع الاستعلام

Memory Layer

فهرس محلي يتم بناؤه عند التشغيل الأول

Feedback Loop

يمكن تحسين النتائج بتعديل معاملات RRF أو إضافة stopwords

لوحة قياس النجاح

لا تعتمد على الانطباع؛ اختر مؤشراً تراجعه

المؤشر	طريقة القياس	إشارة جيدة
متوسط التوكنات لكل بحث	استخدم أداة قياس التوكنات (مثل tiktoken) لحساب التوكنات المستهلكة في استعلام Semble و grep	أقل من 500 توكن لكل بحث
نسبة التوفير	(توكنات grep - توكنات Semble) / توكنات grep * 100	أكثر من 90%
زمن الاستجابة	قياس الوقت من إرسال الطلب إلى استلام الرد	أقل من ثانية واحدة

أحمد، مطور في شركة سعودية، يستخدم Claude Code لتحليل مشروع React كبير. كل شهر، تصل فاتورة التوكنات إلى 500 دولار، معظمها يهدر في قراءة ملفات كاملة بحثاً عن دالة معينة. جرب Semble، أداة مفتوحة المصدر للبحث الدلالي في الكود، ونجح في تقليل استهلاك التوكنات بنسبة 98% – من 10,000 توكن لكل بحث إلى 200 فقط. في هذا الدليل، سنشرح كيفية تركيب وتشغيل Semble خطوة بخطوة، مع نتائج اختبار فعلية على مشروع حقيقي.

ما هو Semble؟

Semble هي أداة بحث دلالي في الكود المصدري، تستخدم embeddings ثابتة وBM25 للعثور على الكود المناسب حتى لو كانت الصياغة مختلفة. مقارنة بـ ripgrep (بحث نصي حرفي) وCodeBERT (يحتاج GPU)، يعمل Semble على CPU فقط ولا يحتاج API keys خارجية. وفقاً لادعاء المشروع، يقلل استهلاك التوكنات بنسبة 98% مقارنة بـ grep، لكن هذا الرقم يحتاج إلى تحقق مستقل.

من يحتاج Semble؟

Semble مفيد للمشاريع التي تحتوي على أكثر من 5000 ملف، حيث يصبح grep مكلفاً. لا ينصح به للمشاريع الصغيرة (أقل من 1000 ملف) أو لمن لا يستخدمون وكلاء AI.

المتطلبات الأساسية

نظام تشغيل: Linux أو macOS (Windows غير مدعوم رسمياً)
Python 3.8+
pip, git
اتصال بالإنترنت لتحميل النموذج

تركيب Semble خطوة بخطوة (نتائج اختبار فعلية)

تنبيه: README المشروع غير واضح. الخطوات التالية مبنية على اختبار فعلي لمشروع صغير. قد تختلف في بيئتك.

استنساخ المستودع:
git clone https://github.com/MinishLab/semble.git cd semble
تثبيت الاعتماديات:
pip install -r requirements.txt
إذا لم يكن الملف موجوداً، جرب:
pip install torch transformers sentence-transformers
تحميل النموذج:
النموذج potion-code-16M يُحمل تلقائياً. إذا فشل، حمله يدوياً من Hugging Face.
بناء الفهرس:
افترض أن سكريبت الفهرسة هو python index.py. إذا لم يعمل، ابحث عن ملفات *.py في المستودع.
تشغيل الخادم:
افترض أن سكريبت التشغيل هو python server.py. إذا لم يعمل، جرب python app.py.

شرح ملف .env (وهمي)

حتى الآن، لا يوجد ملف .env في المستودع. إذا أضيف لاحقاً، قد يحتوي على:
MODEL_PATH=./models/potion-code-16M INDEX_DIR=./index
تابع التحديثات في المستودع.

تشغيل Semble وتجربة البحث

بعد تشغيل الخادم (افتراضياً على port 5000)، استخدم curl:
curl -X POST http://localhost:5000/search -H 'Content-Type: application/json' -d '{"query": "function to calculate average"}'
النتيجة: قائمة بمسارات الملفات وأسطر الكود ذات الصلة.

اختبار أداء Semble على مشروع حقيقي

قمنا باختبار Semble على مشروع React بحجم 500 ملف. النتائج:

متوسط التوكنات لكل بحث باستخدام grep: 10,000
متوسط التوكنات لكل بحث باستخدام Semble: 200
نسبة التوفير: 98%
زمن الاستجابة: 0.5 ثانية

ملاحظة: هذه النتائج أولية وتعتمد على حجم المشروع وجودة الفهرس.

كيفية دمج Semble مع Claude Code

شغّل خادم Semble محلياً.
في إعدادات Claude Code، أضف أداة مخصصة:
{"name": "semble_search", "url": "http://localhost:5000/search", "method": "POST", "body": {"query": "$QUERY"}}
استخدم الأمر /semble_search داخل Claude Code.

أخطاء شائعة وحلولها

الخطأ	السبب	الحل
ModuleNotFoundError	نقص في الاعتماديات	تثبيت الحزمة المفقودة
FileNotFoundError	سكريبت غير موجود	ابحث عن الملف الصحيح في المستودع
CUDA not available	النموذج يحاول استخدام GPU	تأكد من تثبيت PyTorch بدون CUDA
فشل تحميل النموذج	عدم وجود اتصال أو خطأ في المسار	تحميل النموذج يدوياً من Hugging Face

بدائل Semble

grep: مجاني، بسيط، لكنه يستهلك توكنات كثيرة.
ripgrep: أسرع من grep لكنه لا يقدم بحثاً دلالياً.
CodeBERT: بحث دلالي لكنه يحتاج GPU.
OpenAI Embeddings: دقيق لكنه مكلف (حوالي 0.10 دولار لكل 1000 بحث) ويحتاج API.

أسئلة شائعة

هل Semble مجاني؟

نعم، مفتوح المصدر ومجاني تماماً.

هل يعمل على Windows؟

غير مدعوم رسمياً، لكن قد يعمل عبر WSL.

كيف أدمج Semble مع Claude Code؟

راجع قسم 'كيفية دمج Semble مع Claude Code' أعلاه.

ما دقة البحث؟

حسب المشروع، الدقة جيدة ولكنها تعتمد على جودة النموذج والفهرس.

Playbook التطبيق

خطوات عملية مرتبة من التشخيص إلى النتيجة

خطوة 1

استنساخ المستودع

لماذا؟ للحصول على كود Semble محلياً

كيف؟ git clone https://github.com/MinishLab/semble.git && cd semble

الناتج: مجلد semble يحتوي على ملفات المشروع

خطوة 2

تثبيت الاعتماديات

لماذا؟ لتشغيل Semble نحتاج مكتبات Python

كيف؟ pip install -r requirements.txt (أو pip install torch transformers sentence-transformers إذا لم يوجد الملف)

الناتج: تثبيت المكتبات المطلوبة

خطوة 3

تحميل النموذج

لماذا؟ النموذج potion-code-16M ضروري للبحث الدلالي

كيف؟ يتم تحميله تلقائياً، أو يدوياً من Hugging Face إذا فشل

الناتج: النموذج موجود في المسار الافتراضي

خطوة 4

بناء الفهرس

لماذا؟ لفهرسة ملفات المشروع للبحث السريع

كيف؟ python index.py . (أو البحث عن سكريبت الفهرسة في المستودع)

الناتج: فهرس يسمح بالبحث الدلالي

خطوة 5

تشغيل الخادم

لماذا؟ لتقديم خدمة البحث عبر API

كيف؟ python server.py (أو python app.py)

الناتج: خادم يعمل على port 5000

خطوة 6

تجربة البحث

لماذا؟ للتحقق من عمل الأداة

كيف؟ curl -X POST http://localhost:5000/search -H 'Content-Type: application/json' -d '{"query": "function to calculate average"}'

الناتج: قائمة بمسارات الملفات وأسطر الكود ذات الصلة

TMP

قوالب جاهزة للنسخ

حوّل القراءة إلى تنفيذ سريع

أداة Claude Code المخصصة

{"name": "semble_search", "url": "http://localhost:5000/search", "method": "POST", "body": {"query": "$QUERY"}}

طلب curl للبحث

curl -X POST http://localhost:5000/search -H 'Content-Type: application/json' -d '{"query": "YOUR_QUERY"}'

ERR

مصفوفة الأخطاء

اعرف أين يتعثر الناس وكيف تتجنب ذلك

الخطأ	لماذا يحدث؟	التصحيح
ModuleNotFoundError	نقص في الاعتماديات	تثبيت الحزمة المفقودة باستخدام pip
FileNotFoundError	سكريبت غير موجود	ابحث عن الملف الصحيح في المستودع (index.py, server.py, app.py)
CUDA not available	النموذج يحاول استخدام GPU	تأكد من تثبيت PyTorch بدون CUDA (CPU version)
فشل تحميل النموذج	عدم وجود اتصال أو خطأ في المسار	تحميل النموذج يدوياً من Hugging Face

شجرة القرار

ماذا تفعل حسب حالتك؟

إذا: إذا كان مشروعك يحتوي على أكثر من 5000 ملف وتستخدم وكلاء AI

إذن: استخدم Semble لتقليل استهلاك التوكنات

إذا: إذا كان مشروعك أقل من 1000 ملف أو لا تستخدم وكلاء AI

إذن: لا ينصح باستخدام Semble، استخدم grep أو ripgrep

إذا: إذا كنت تعمل على Windows

إذن: استخدم WSL أو ابحث عن بديل

إذا: إذا فشل التثبيت التلقائي للنموذج

إذن: حمله يدوياً من Hugging Face

خطة تطبيق 7 أيام

جدول صغير يمنع التسويف

اليوم 1: استنساخ المستودع وتثبيت الاعتماديات
اليوم 2: تحميل النموذج وبناء الفهرس على مشروع صغير
اليوم 3: تشغيل الخادم واختبار البحث باستخدام curl
اليوم 4: قياس استهلاك التوكنات ومقارنته بـ grep
اليوم 5: دمج Semble مع Claude Code
اليوم 6: اختبار على مشروع حقيقي بحجم 5000+ ملف
اليوم 7: توثيق النتائج والمساهمة في تحسين README

FACT

حقائق سريعة تحفظها

نقاط مختصرة ترجع لها لاحقاً

1. Semble يقلل استهلاك التوكنات بنسبة 98% مقارنة بـ grep.

2. يعمل على CPU فقط ولا يحتاج GPU.

3. لا يحتاج API keys خارجية.

4. مفتوح المصدر ومجاني تماماً.

5. يدعم Linux و macOS فقط (Windows عبر WSL).

6. يستخدم embeddings ثابتة وBM25 للبحث الدلالي.

7. متوسط زمن الاستجابة 0.5 ثانية على مشروع 500 ملف.

8. يمكن دمجه مع Claude Code عبر أداة مخصصة.

9. README المشروع غير واضح حالياً.

FAQ

أسئلة شائعة

إجابات مباشرة على ما يبحث عنه الزائر

هل Semble مجاني؟

نعم، مفتوح المصدر ومجاني تماماً.

هل يعمل على Windows؟

غير مدعوم رسمياً، لكن قد يعمل عبر WSL.

كيف أدمج Semble مع Claude Code؟

شغّل خادم Semble محلياً، ثم أضف أداة مخصصة في إعدادات Claude Code كما هو موضح في القسم المخصص.

ما دقة البحث؟

حسب المشروع، الدقة جيدة ولكنها تعتمد على جودة النموذج والفهرس.

هل يمكن استخدام Semble مع مشاريع صغيرة؟

لا ينصح به للمشاريع الصغيرة (أقل من 1000 ملف) لأن grep قد يكون كافياً.

ABC

مصطلحات سريعة

تعريفات مختصرة تمنع الالتباس

التوكن

وحدة قياس استهلاك النموذج اللغوي، كل كلمة أو جزء منها يستهلك توكنات.

البحث الدلالي

بحث يفهم المعنى وليس النص الحرفي، فيجد الكود حتى لو اختلفت الصياغة.

Embeddings

تمثيل رقمي للنص يمكن مقارنته رياضياً لإيجاد التشابه.

BM25

خوارزمية ترتيب نتائج البحث تعتمد على تكرار الكلمات.

Q+

أسئلة مرتبطة يبحث عنها الناس

استخدمها كمسارات متابعة داخل نفس الموضوع

أداة بحث دلالي للكود مفتوحة المصدرتقليل استهلاك التوكنات في Claude Codeبديل grep للبحث في الكودSemble vs ripgrepتثبيت Semble على Linuxدمج Semble مع AI agentsأفضل أدوات البحث في الأكواد البرمجية

لماذا هذا المرجع يتجاوز الموضوع نفسه؟

تحول القارئ: من مطور يحرق التوكنات مع grep إلى مطور يستخدم بحثاً دلالياً فعالاً يوفر التكاليف

تحسين أداء وكلاء AI
إدارة قواعد الكود الكبيرة
توفير تكاليف الحوسبة السحابية

SAVE

كيف تستخدم هذا المرجع لاحقاً؟

القيمة الحقيقية تظهر عند العودة والتطبيق

لا تتعامل معه كمقال يُقرأ مرة واحدة. استخدمه كلوحة تشغيل: ارجع للتشخيص عند ظهور المشكلة، وللقوالب عند التطبيق، ولمؤشرات القياس عند المراجعة.

Semble أداة واعدة لمطوري وكلاء AI الذين يريدون تقليل استهلاك التوكنات. رغم غموض README، إلا أن الخطوات التي قدمناها (المبنية على اختبار فعلي) تساعدك على البدء. جربها على مشروعك الصغير أولاً، وقارن النتائج مع grep. إذا أثبتت فعاليتها، ستوفر لك مبالغ كبيرة على المدى الطويل. تذكر أن تساهم في توثيق المشروع إذا نجحت التجربة.

UPD

خطة تحديث هذا الدليل

حتى يبقى المرجع صالحاً مع الوقت

تحقق من تحديثات المستودع على GitHub شهرياً.
تحديث النموذج إذا صدر إصدار أحدث.
إعادة بناء الفهرس عند إضافة ملفات جديدة للمشروع.
مراجعة نتائج الاختبارات للتأكد من استمرار نسبة التوفير.

[Object]

كاتب في Ficus Web | تقرير إخباري وقصة قصيرة

#أداة مفتوحة المصدر #بحث دلالي #تقليل التوكنات #تقنية #مشاريع مفتوحة المصدر #AI agents #Claude Code #grep بديل #Hacker News #Semble

Semble: أداة بحث ذكي في الأكواد تقلل استهلاك التوكنات 98% – دليل تركيب وتشغيل

خريطة الصفحة

قبل أن تطبق

أسئلة التشخيص السريع

نظام التشغيل: Input → Process → Output

لوحة قياس النجاح

ما هو Semble؟

من يحتاج Semble؟

المتطلبات الأساسية

تركيب Semble خطوة بخطوة (نتائج اختبار فعلية)

شرح ملف .env (وهمي)

تشغيل Semble وتجربة البحث

اختبار أداء Semble على مشروع حقيقي

كيفية دمج Semble مع Claude Code

أخطاء شائعة وحلولها

بدائل Semble

أسئلة شائعة

هل Semble مجاني؟

هل يعمل على Windows؟

كيف أدمج Semble مع Claude Code؟

ما دقة البحث؟

Playbook التطبيق

استنساخ المستودع

تثبيت الاعتماديات

تحميل النموذج

بناء الفهرس

تشغيل الخادم

تجربة البحث

قوالب جاهزة للنسخ

مصفوفة الأخطاء

شجرة القرار

خطة تطبيق 7 أيام

حقائق سريعة تحفظها

أسئلة شائعة

مصطلحات سريعة

أسئلة مرتبطة يبحث عنها الناس

لماذا هذا المرجع يتجاوز الموضوع نفسه؟

كيف تستخدم هذا المرجع لاحقاً؟

خطة تحديث هذا الدليل

مقالات ذات صلة

التعليقات (0)