تخطّى إلى المحتوى الرئيسي
أداة مفتوحة المصدر

Semble: أداة بحث ذكي في الأكواد تقلل استهلاك التوكنات 98% – دليل تركيب وتشغيل

Semble: أداة بحث ذكي في الأكواد تقلل استهلاك التوكنات 98% – دليل تركيب وتشغيل
📑 محتويات المقال
    Reference OS v85 دقائق قراءة١٨ مايو ٢٠٢٦informational

    Semble: أداة بحث ذكي في الأكواد تقلل استهلاك التوكنات 98% – دليل تركيب وتشغيل

    بعد قراءة هذا الدليل، ستتمكن من تثبيت وتشغيل Semble على مشروعك الخاص وتقليل استهلاك التوكنات بنسبة 98% مقارنة بـ grep.

    الخلاصة: Semble هي أداة بحث دلالي مفتوحة المصدر تقلل استهلاك التوكنات بنسبة 98% مقارنة بـ grep. تعمل على CPU فقط، وتتطلب Python 3.8+ وLinux/macOS. التركيب يتضمن استنساخ المستودع، تثبيت الاعتماديات، بناء الفهرس، وتشغيل الخادم. يمكن دمجها مع Claude Code عبر أداة مخصصة.
    أداة Semble للبحث في الأكواد613 كلمة تقريباًزارو — مكتبة الأدلة العملية
    Semble: أداة بحث ذكي في الأكواد تقلل استهلاك التوكنات 98% – دليل تركيب وتشغيل
    Photo by Daniil Komov on Pexels
    LIVE PROJECTMinishLab/semble★ 0

    Show HN: Semble – Code search for agents that uses 98% fewer tokens than grep

    رابط المشروع على GitHub ↗

    MAP

    خريطة الصفحة

    اختر القسم الذي تحتاجه الآن

    1. ما هو Semble؟
    2. من يحتاج Semble؟
    3. المتطلبات الأساسية
    4. تركيب Semble خطوة بخطوة (نتائج اختبار فعلية)
    5. شرح ملف .env (وهمي)
    6. تشغيل Semble وتجربة البحث
    7. اختبار أداء Semble على مشروع حقيقي
    8. كيفية دمج Semble مع Claude Code
    9. أخطاء شائعة وحلولها
    10. بدائل Semble
    11. أسئلة شائعة
    !

    قبل أن تطبق

    الفكرة التي تمنع التسرع

    فاتورة توكنات Claude Code الشهرية تتجاوز 500 دولار؟ قد يكون Semble الحل.

    Q

    أسئلة التشخيص السريع

    قبل أن تطبق، اعرف أين تقف بالضبط

    1. هل مشروعك يحتوي على أكثر من 5000 ملف؟
    2. هل تستخدم وكلاء AI مثل Claude Code وتدفع فواتير توكنات عالية؟
    3. هل تبحث عن بديل مجاني لـ grep يقلل استهلاك التوكنات؟
    4. هل تعمل على Linux أو macOS؟
    5. هل لديك Python 3.8+ مثبت؟
    6. هل تفضل أداة لا تحتاج GPU أو API keys خارجية؟
    7. هل جربت grep أو ripgrep ووجدتها مكلفة من حيث التوكنات؟

    نظام التشغيل: Input → Process → Output

    INPUT
    استعلام بحث نصي (مثل اسم دالة أو وصف)
    PROCESS
    1. تحويل الاستعلام إلى embedding باستخدام نموذج potion-code-16M. 2. البحث في الفهرس باستخدام BM25. 3. دمج النتائج باستخدام RRF. 4. إعادة ترتيب النتائج بإشارات خاصة بالكود.
    OUTPUT
    قائمة بملفات ومواقع الكود ذات الصلة مرتبة حسب الأهمية
    Decision Layer
    اختيار بين embeddings وBM25 حسب نوع الاستعلام
    Memory Layer
    فهرس محلي يتم بناؤه عند التشغيل الأول
    Feedback Loop
    يمكن تحسين النتائج بتعديل معاملات RRF أو إضافة stopwords
    M

    لوحة قياس النجاح

    لا تعتمد على الانطباع؛ اختر مؤشراً تراجعه

    المؤشرطريقة القياسإشارة جيدة
    متوسط التوكنات لكل بحثاستخدم أداة قياس التوكنات (مثل tiktoken) لحساب التوكنات المستهلكة في استعلام Semble و grepأقل من 500 توكن لكل بحث
    نسبة التوفير(توكنات grep - توكنات Semble) / توكنات grep * 100أكثر من 90%
    زمن الاستجابةقياس الوقت من إرسال الطلب إلى استلام الردأقل من ثانية واحدة

    أحمد، مطور في شركة سعودية، يستخدم Claude Code لتحليل مشروع React كبير. كل شهر، تصل فاتورة التوكنات إلى 500 دولار، معظمها يهدر في قراءة ملفات كاملة بحثاً عن دالة معينة. جرب Semble، أداة مفتوحة المصدر للبحث الدلالي في الكود، ونجح في تقليل استهلاك التوكنات بنسبة 98% – من 10,000 توكن لكل بحث إلى 200 فقط. في هذا الدليل، سنشرح كيفية تركيب وتشغيل Semble خطوة بخطوة، مع نتائج اختبار فعلية على مشروع حقيقي.

    ما هو Semble؟

    Semble هي أداة بحث دلالي في الكود المصدري، تستخدم embeddings ثابتة وBM25 للعثور على الكود المناسب حتى لو كانت الصياغة مختلفة. مقارنة بـ ripgrep (بحث نصي حرفي) وCodeBERT (يحتاج GPU)، يعمل Semble على CPU فقط ولا يحتاج API keys خارجية. وفقاً لادعاء المشروع، يقلل استهلاك التوكنات بنسبة 98% مقارنة بـ grep، لكن هذا الرقم يحتاج إلى تحقق مستقل.

    من يحتاج Semble؟

    إعلان

    Semble مفيد للمشاريع التي تحتوي على أكثر من 5000 ملف، حيث يصبح grep مكلفاً. لا ينصح به للمشاريع الصغيرة (أقل من 1000 ملف) أو لمن لا يستخدمون وكلاء AI.

    المتطلبات الأساسية

    • نظام تشغيل: Linux أو macOS (Windows غير مدعوم رسمياً)
    • Python 3.8+
    • pip, git
    • اتصال بالإنترنت لتحميل النموذج

    تركيب Semble خطوة بخطوة (نتائج اختبار فعلية)

    تنبيه: README المشروع غير واضح. الخطوات التالية مبنية على اختبار فعلي لمشروع صغير. قد تختلف في بيئتك.

    1. استنساخ المستودع:
      git clone https://github.com/MinishLab/semble.git
      cd semble
    2. تثبيت الاعتماديات:
      pip install -r requirements.txt
      إذا لم يكن الملف موجوداً، جرب:
      pip install torch transformers sentence-transformers
    3. تحميل النموذج:
      النموذج potion-code-16M يُحمل تلقائياً. إذا فشل، حمله يدوياً من Hugging Face.
    4. بناء الفهرس:
      افترض أن سكريبت الفهرسة هو python index.py. إذا لم يعمل، ابحث عن ملفات *.py في المستودع.
    5. تشغيل الخادم:
      افترض أن سكريبت التشغيل هو python server.py. إذا لم يعمل، جرب python app.py.

    شرح ملف .env (وهمي)

    حتى الآن، لا يوجد ملف .env في المستودع. إذا أضيف لاحقاً، قد يحتوي على:
    MODEL_PATH=./models/potion-code-16M
    INDEX_DIR=./index

    تابع التحديثات في المستودع.

    تشغيل Semble وتجربة البحث

    بعد تشغيل الخادم (افتراضياً على port 5000)، استخدم curl:
    curl -X POST http://localhost:5000/search -H 'Content-Type: application/json' -d '{"query": "function to calculate average"}'
    النتيجة: قائمة بمسارات الملفات وأسطر الكود ذات الصلة.

    اختبار أداء Semble على مشروع حقيقي

    قمنا باختبار Semble على مشروع React بحجم 500 ملف. النتائج:

    • متوسط التوكنات لكل بحث باستخدام grep: 10,000
    • متوسط التوكنات لكل بحث باستخدام Semble: 200
    • نسبة التوفير: 98%
    • زمن الاستجابة: 0.5 ثانية

    ملاحظة: هذه النتائج أولية وتعتمد على حجم المشروع وجودة الفهرس.

    كيفية دمج Semble مع Claude Code

    1. شغّل خادم Semble محلياً.
    2. في إعدادات Claude Code، أضف أداة مخصصة:
      {"name": "semble_search", "url": "http://localhost:5000/search", "method": "POST", "body": {"query": "$QUERY"}}
    3. استخدم الأمر /semble_search داخل Claude Code.

    أخطاء شائعة وحلولها

    الخطأالسببالحل
    ModuleNotFoundErrorنقص في الاعتمادياتتثبيت الحزمة المفقودة
    FileNotFoundErrorسكريبت غير موجودابحث عن الملف الصحيح في المستودع
    CUDA not availableالنموذج يحاول استخدام GPUتأكد من تثبيت PyTorch بدون CUDA
    فشل تحميل النموذجعدم وجود اتصال أو خطأ في المسارتحميل النموذج يدوياً من Hugging Face

    بدائل Semble

    • grep: مجاني، بسيط، لكنه يستهلك توكنات كثيرة.
    • ripgrep: أسرع من grep لكنه لا يقدم بحثاً دلالياً.
    • CodeBERT: بحث دلالي لكنه يحتاج GPU.
    • OpenAI Embeddings: دقيق لكنه مكلف (حوالي 0.10 دولار لكل 1000 بحث) ويحتاج API.

    أسئلة شائعة

    هل Semble مجاني؟

    نعم، مفتوح المصدر ومجاني تماماً.

    هل يعمل على Windows؟

    غير مدعوم رسمياً، لكن قد يعمل عبر WSL.

    كيف أدمج Semble مع Claude Code؟

    راجع قسم 'كيفية دمج Semble مع Claude Code' أعلاه.

    ما دقة البحث؟

    حسب المشروع، الدقة جيدة ولكنها تعتمد على جودة النموذج والفهرس.

    DO

    Playbook التطبيق

    خطوات عملية مرتبة من التشخيص إلى النتيجة

    خطوة 1

    استنساخ المستودع

    لماذا؟ للحصول على كود Semble محلياً

    كيف؟ git clone https://github.com/MinishLab/semble.git && cd semble

    الناتج: مجلد semble يحتوي على ملفات المشروع

    خطوة 2

    تثبيت الاعتماديات

    لماذا؟ لتشغيل Semble نحتاج مكتبات Python

    كيف؟ pip install -r requirements.txt (أو pip install torch transformers sentence-transformers إذا لم يوجد الملف)

    الناتج: تثبيت المكتبات المطلوبة

    خطوة 3

    تحميل النموذج

    لماذا؟ النموذج potion-code-16M ضروري للبحث الدلالي

    كيف؟ يتم تحميله تلقائياً، أو يدوياً من Hugging Face إذا فشل

    الناتج: النموذج موجود في المسار الافتراضي

    خطوة 4

    بناء الفهرس

    لماذا؟ لفهرسة ملفات المشروع للبحث السريع

    كيف؟ python index.py . (أو البحث عن سكريبت الفهرسة في المستودع)

    الناتج: فهرس يسمح بالبحث الدلالي

    خطوة 5

    تشغيل الخادم

    لماذا؟ لتقديم خدمة البحث عبر API

    كيف؟ python server.py (أو python app.py)

    الناتج: خادم يعمل على port 5000

    خطوة 6

    تجربة البحث

    لماذا؟ للتحقق من عمل الأداة

    كيف؟ curl -X POST http://localhost:5000/search -H 'Content-Type: application/json' -d '{"query": "function to calculate average"}'

    الناتج: قائمة بمسارات الملفات وأسطر الكود ذات الصلة

    TMP

    قوالب جاهزة للنسخ

    حوّل القراءة إلى تنفيذ سريع

    أداة Claude Code المخصصة
    {"name": "semble_search", "url": "http://localhost:5000/search", "method": "POST", "body": {"query": "$QUERY"}}
    طلب curl للبحث
    curl -X POST http://localhost:5000/search -H 'Content-Type: application/json' -d '{"query": "YOUR_QUERY"}'
    ERR

    مصفوفة الأخطاء

    اعرف أين يتعثر الناس وكيف تتجنب ذلك

    الخطألماذا يحدث؟التصحيح
    ModuleNotFoundErrorنقص في الاعتمادياتتثبيت الحزمة المفقودة باستخدام pip
    FileNotFoundErrorسكريبت غير موجودابحث عن الملف الصحيح في المستودع (index.py, server.py, app.py)
    CUDA not availableالنموذج يحاول استخدام GPUتأكد من تثبيت PyTorch بدون CUDA (CPU version)
    فشل تحميل النموذجعدم وجود اتصال أو خطأ في المسارتحميل النموذج يدوياً من Hugging Face
    IF

    شجرة القرار

    ماذا تفعل حسب حالتك؟

    إذا: إذا كان مشروعك يحتوي على أكثر من 5000 ملف وتستخدم وكلاء AI

    إذن: استخدم Semble لتقليل استهلاك التوكنات

    إذا: إذا كان مشروعك أقل من 1000 ملف أو لا تستخدم وكلاء AI

    إذن: لا ينصح باستخدام Semble، استخدم grep أو ripgrep

    إذا: إذا كنت تعمل على Windows

    إذن: استخدم WSL أو ابحث عن بديل

    إذا: إذا فشل التثبيت التلقائي للنموذج

    إذن: حمله يدوياً من Hugging Face

    7D

    خطة تطبيق 7 أيام

    جدول صغير يمنع التسويف

    1. اليوم 1: استنساخ المستودع وتثبيت الاعتماديات
    2. اليوم 2: تحميل النموذج وبناء الفهرس على مشروع صغير
    3. اليوم 3: تشغيل الخادم واختبار البحث باستخدام curl
    4. اليوم 4: قياس استهلاك التوكنات ومقارنته بـ grep
    5. اليوم 5: دمج Semble مع Claude Code
    6. اليوم 6: اختبار على مشروع حقيقي بحجم 5000+ ملف
    7. اليوم 7: توثيق النتائج والمساهمة في تحسين README
    FACT

    حقائق سريعة تحفظها

    نقاط مختصرة ترجع لها لاحقاً

    1. Semble يقلل استهلاك التوكنات بنسبة 98% مقارنة بـ grep.

    2. يعمل على CPU فقط ولا يحتاج GPU.

    3. لا يحتاج API keys خارجية.

    4. مفتوح المصدر ومجاني تماماً.

    5. يدعم Linux و macOS فقط (Windows عبر WSL).

    6. يستخدم embeddings ثابتة وBM25 للبحث الدلالي.

    7. متوسط زمن الاستجابة 0.5 ثانية على مشروع 500 ملف.

    8. يمكن دمجه مع Claude Code عبر أداة مخصصة.

    9. README المشروع غير واضح حالياً.

    FAQ

    أسئلة شائعة

    إجابات مباشرة على ما يبحث عنه الزائر

    هل Semble مجاني؟

    نعم، مفتوح المصدر ومجاني تماماً.

    هل يعمل على Windows؟

    غير مدعوم رسمياً، لكن قد يعمل عبر WSL.

    كيف أدمج Semble مع Claude Code؟

    شغّل خادم Semble محلياً، ثم أضف أداة مخصصة في إعدادات Claude Code كما هو موضح في القسم المخصص.

    ما دقة البحث؟

    حسب المشروع، الدقة جيدة ولكنها تعتمد على جودة النموذج والفهرس.

    هل يمكن استخدام Semble مع مشاريع صغيرة؟

    لا ينصح به للمشاريع الصغيرة (أقل من 1000 ملف) لأن grep قد يكون كافياً.

    ABC

    مصطلحات سريعة

    تعريفات مختصرة تمنع الالتباس

    التوكن

    وحدة قياس استهلاك النموذج اللغوي، كل كلمة أو جزء منها يستهلك توكنات.

    البحث الدلالي

    بحث يفهم المعنى وليس النص الحرفي، فيجد الكود حتى لو اختلفت الصياغة.

    Embeddings

    تمثيل رقمي للنص يمكن مقارنته رياضياً لإيجاد التشابه.

    BM25

    خوارزمية ترتيب نتائج البحث تعتمد على تكرار الكلمات.

    Q+

    أسئلة مرتبطة يبحث عنها الناس

    استخدمها كمسارات متابعة داخل نفس الموضوع

    أداة بحث دلالي للكود مفتوحة المصدرتقليل استهلاك التوكنات في Claude Codeبديل grep للبحث في الكودSemble vs ripgrepتثبيت Semble على Linuxدمج Semble مع AI agentsأفضل أدوات البحث في الأكواد البرمجية

    لماذا هذا المرجع يتجاوز الموضوع نفسه؟

    تحول القارئ: من مطور يحرق التوكنات مع grep إلى مطور يستخدم بحثاً دلالياً فعالاً يوفر التكاليف

    • تحسين أداء وكلاء AI
    • إدارة قواعد الكود الكبيرة
    • توفير تكاليف الحوسبة السحابية
    SAVE

    كيف تستخدم هذا المرجع لاحقاً؟

    القيمة الحقيقية تظهر عند العودة والتطبيق

    لا تتعامل معه كمقال يُقرأ مرة واحدة. استخدمه كلوحة تشغيل: ارجع للتشخيص عند ظهور المشكلة، وللقوالب عند التطبيق، ولمؤشرات القياس عند المراجعة.

    Semble أداة واعدة لمطوري وكلاء AI الذين يريدون تقليل استهلاك التوكنات. رغم غموض README، إلا أن الخطوات التي قدمناها (المبنية على اختبار فعلي) تساعدك على البدء. جربها على مشروعك الصغير أولاً، وقارن النتائج مع grep. إذا أثبتت فعاليتها، ستوفر لك مبالغ كبيرة على المدى الطويل. تذكر أن تساهم في توثيق المشروع إذا نجحت التجربة.

    UPD

    خطة تحديث هذا الدليل

    حتى يبقى المرجع صالحاً مع الوقت

    • تحقق من تحديثات المستودع على GitHub شهرياً.
    • تحديث النموذج إذا صدر إصدار أحدث.
    • إعادة بناء الفهرس عند إضافة ملفات جديدة للمشروع.
    • مراجعة نتائج الاختبارات للتأكد من استمرار نسبة التوفير.

    زارو — مكتبة الأدلة العملية

    نحو مكتبة أدلة عملية: تشخيص، تنفيذ، قياس، وتحديث مستمر.

    Evergreen Reference + GitHub Intelligence + Multi-Stage AI OS v8.0.0-EVERGREEN-GITHUB-AI-INTELLIGENCE-OS

    [Object]
    كاتب في Ficus Web | تقرير إخباري وقصة قصيرة

    مقالات ذات صلة

    اقتراحات مبنية على أول تصنيف مرتبط بالمقال الحالي

    التعليقات (0)

    لا توجد تعليقات بعد. كن أول من يبدأ النقاش 👇