From 6ed917d986599fad867b3572c63867b5c6e5e441 Mon Sep 17 00:00:00 2001
From: prosdev <prosdevlab@gmail.com>
Date: Wed, 1 Apr 2026 23:15:06 -0700
Subject: [PATCH 1/2] fix(mcp): drop misleading search scores and fix refs
 score threshold

Search results displayed RRF fusion scores as percentages (always ~1-2%),
which were meaningless to agents. Removed score display from both formatters,
added a result count preamble, and removed scoreThreshold from the MCP tool
schema. Also fixed SearchService defaulting scoreThreshold to 0.7 which
silently filtered out all results for dev_refs since RRF scores are ~0.01.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 .../services/__tests__/search-service.test.ts |  2 +-
 packages/core/src/services/search-service.ts  |  2 +-
 packages/mcp-server/CLAUDE_CODE_SETUP.md      |  2 +-
 packages/mcp-server/CURSOR_SETUP.md           |  2 +-
 .../adapters/__tests__/search-adapter.test.ts | 62 +------------------
 .../src/adapters/built-in/search-adapter.ts   | 17 ++---
 .../formatters/__tests__/formatters.test.ts   | 20 +++---
 .../src/formatters/__tests__/utils.test.ts    | 16 +++--
 .../src/formatters/compact-formatter.ts       |  5 +-
 .../src/formatters/verbose-formatter.ts       |  5 +-
 .../src/schemas/__tests__/schemas.test.ts     |  1 -
 packages/mcp-server/src/schemas/index.ts      |  1 -
 12 files changed, 32 insertions(+), 103 deletions(-)

diff --git a/packages/core/src/services/__tests__/search-service.test.ts b/packages/core/src/services/__tests__/search-service.test.ts
index 1135265..a189b59 100644
--- a/packages/core/src/services/__tests__/search-service.test.ts
+++ b/packages/core/src/services/__tests__/search-service.test.ts
@@ -81,7 +81,7 @@ describe('SearchService', () => {
 
       expect(mockIndexer.search).toHaveBeenCalledWith('test query', {
         limit: 10,
-        scoreThreshold: 0.7,
+        scoreThreshold: 0,
       });
     });
 
diff --git a/packages/core/src/services/search-service.ts b/packages/core/src/services/search-service.ts
index 058eca3..c5c85a8 100644
--- a/packages/core/src/services/search-service.ts
+++ b/packages/core/src/services/search-service.ts
@@ -103,7 +103,7 @@ export class SearchService {
     try {
       const results = await indexer.search(query, {
         limit: options?.limit ?? 10,
-        scoreThreshold: options?.scoreThreshold ?? 0.7,
+        scoreThreshold: options?.scoreThreshold ?? 0,
       });
       return results;
     } finally {
diff --git a/packages/mcp-server/CLAUDE_CODE_SETUP.md b/packages/mcp-server/CLAUDE_CODE_SETUP.md
index 839f6c9..5fd0d52 100644
--- a/packages/mcp-server/CLAUDE_CODE_SETUP.md
+++ b/packages/mcp-server/CLAUDE_CODE_SETUP.md
@@ -35,7 +35,7 @@ Find authentication middleware that handles JWT tokens
 - `query` (required): Natural language search query
 - `format`: `compact` (default) or `verbose`
 - `limit`: Number of results (1-50, default: 10)
-- `scoreThreshold`: Minimum relevance (0-1, default: 0)
+- `tokenBudget`: Maximum tokens for results (500-10000)
 
 ### `dev_status` - Repository Status
 Get indexing status and repository health information.
diff --git a/packages/mcp-server/CURSOR_SETUP.md b/packages/mcp-server/CURSOR_SETUP.md
index 048bf28..3bd34e6 100644
--- a/packages/mcp-server/CURSOR_SETUP.md
+++ b/packages/mcp-server/CURSOR_SETUP.md
@@ -35,7 +35,7 @@ Find authentication middleware that handles JWT tokens
 - `query` (required): Natural language search query
 - `format`: `compact` (default) or `verbose`
 - `limit`: Number of results (1-50, default: 10)
-- `scoreThreshold`: Minimum relevance (0-1, default: 0)
+- `tokenBudget`: Maximum tokens for results (500-10000)
 
 ### `dev_status` - Repository Status
 Get indexing status and repository health information.
diff --git a/packages/mcp-server/src/adapters/__tests__/search-adapter.test.ts b/packages/mcp-server/src/adapters/__tests__/search-adapter.test.ts
index 67dddde..c9a3617 100644
--- a/packages/mcp-server/src/adapters/__tests__/search-adapter.test.ts
+++ b/packages/mcp-server/src/adapters/__tests__/search-adapter.test.ts
@@ -102,7 +102,7 @@ describe('SearchAdapter', () => {
       expect(def.inputSchema.properties).toHaveProperty('query');
       expect(def.inputSchema.properties).toHaveProperty('format');
       expect(def.inputSchema.properties).toHaveProperty('limit');
-      expect(def.inputSchema.properties).toHaveProperty('scoreThreshold');
+      expect(def.inputSchema.properties).not.toHaveProperty('scoreThreshold');
       expect(def.inputSchema.required).toContain('query');
     });
 
@@ -236,48 +236,6 @@ describe('SearchAdapter', () => {
     });
   });
 
-  describe('Score Threshold Validation', () => {
-    it('should accept valid threshold', async () => {
-      const result = await adapter.execute(
-        {
-          query: 'test',
-          scoreThreshold: 0.5,
-        },
-        execContext
-      );
-
-      expect(result.success).toBe(true);
-    });
-
-    it('should reject threshold below 0', async () => {
-      const result = await adapter.execute(
-        {
-          query: 'test',
-          scoreThreshold: -0.1,
-        },
-        execContext
-      );
-
-      expect(result.success).toBe(false);
-      expect(result.error?.code).toBe('INVALID_PARAMS');
-      expect(result.error?.message).toContain('scoreThreshold');
-    });
-
-    it('should reject threshold above 1', async () => {
-      const result = await adapter.execute(
-        {
-          query: 'test',
-          scoreThreshold: 1.1,
-        },
-        execContext
-      );
-
-      expect(result.success).toBe(false);
-      expect(result.error?.code).toBe('INVALID_PARAMS');
-      expect(result.error?.message).toContain('scoreThreshold');
-    });
-  });
-
   describe('Search Execution', () => {
     it('should return search results', async () => {
       const result = await adapter.execute(
@@ -295,7 +253,6 @@ describe('SearchAdapter', () => {
       expect(result.metadata).toHaveProperty('results_total', 2);
       expect(mockIndexer.search).toHaveBeenCalledWith('authentication', {
         limit: 10,
-        scoreThreshold: 0,
       });
     });
 
@@ -325,27 +282,10 @@ describe('SearchAdapter', () => {
       expect(result.success).toBe(true);
       expect(mockIndexer.search).toHaveBeenCalledWith('test', {
         limit: 3,
-        scoreThreshold: 0,
       });
       expect(result.metadata?.results_total).toBe(2); // Mock returns 2 results
     });
 
-    it('should respect score threshold parameter', async () => {
-      const result = await adapter.execute(
-        {
-          query: 'test',
-          scoreThreshold: 0.9,
-        },
-        execContext
-      );
-
-      expect(result.success).toBe(true);
-      expect(mockIndexer.search).toHaveBeenCalledWith('test', {
-        limit: 10,
-        scoreThreshold: 0.9,
-      });
-    });
-
     it('compact format should use fewer tokens than verbose', async () => {
       const compactResult = await adapter.execute(
         {
diff --git a/packages/mcp-server/src/adapters/built-in/search-adapter.ts b/packages/mcp-server/src/adapters/built-in/search-adapter.ts
index ae3e883..cd85c91 100644
--- a/packages/mcp-server/src/adapters/built-in/search-adapter.ts
+++ b/packages/mcp-server/src/adapters/built-in/search-adapter.ts
@@ -106,13 +106,6 @@ export class SearchAdapter extends ToolAdapter {
             maximum: 50,
             default: this.config.defaultLimit,
           },
-          scoreThreshold: {
-            type: 'number',
-            description: 'Minimum similarity score (0-1). Lower = more results (default: 0)',
-            minimum: 0,
-            maximum: 1,
-            default: 0,
-          },
           tokenBudget: {
             type: 'number',
             description:
@@ -133,7 +126,7 @@ export class SearchAdapter extends ToolAdapter {
       return validation.error;
     }
 
-    const { query, format, limit, scoreThreshold, tokenBudget } = validation.data;
+    const { query, format, limit, tokenBudget } = validation.data;
 
     try {
       const startTime = Date.now();
@@ -141,14 +134,12 @@ export class SearchAdapter extends ToolAdapter {
         query,
         format,
         limit,
-        scoreThreshold,
         tokenBudget,
       });
 
       // Perform search using SearchService
       const results = await this.searchService.search(query as string, {
         limit: limit as number,
-        scoreThreshold: scoreThreshold as number,
       });
 
       // Create formatter with token budget if specified
@@ -194,10 +185,14 @@ export class SearchAdapter extends ToolAdapter {
         duration_ms,
       });
 
+      // Build preamble with result count
+      const returned = Math.min(results.length, limit as number);
+      const preamble = `Found ${results.length} results for "${query}" | showing top ${returned}\n\n`;
+
       // Return markdown content (MCP will wrap in content blocks)
       return {
         success: true,
-        data: formatted.content + relatedFilesSection,
+        data: preamble + formatted.content + relatedFilesSection,
         metadata: {
           tokens: formatted.tokens,
           duration_ms,
diff --git a/packages/mcp-server/src/formatters/__tests__/formatters.test.ts b/packages/mcp-server/src/formatters/__tests__/formatters.test.ts
index 0b21221..32e1cf9 100644
--- a/packages/mcp-server/src/formatters/__tests__/formatters.test.ts
+++ b/packages/mcp-server/src/formatters/__tests__/formatters.test.ts
@@ -55,7 +55,7 @@ describe('Formatters', () => {
       const formatter = new CompactFormatter();
       const formatted = formatter.formatResult(mockResults[0]);
 
-      expect(formatted).toContain('[89%]');
+      expect(formatted).not.toContain('[89%]');
       expect(formatted).toContain('class:');
       expect(formatted).toContain('AuthMiddleware');
       expect(formatted).toContain('src/auth/middleware.ts');
@@ -66,9 +66,9 @@ describe('Formatters', () => {
       const formatter = new CompactFormatter();
       const result = formatter.formatResults(mockResults);
 
-      expect(result.content).toContain('1. [89%]');
-      expect(result.content).toContain('2. [84%]');
-      expect(result.content).toContain('3. [72%]');
+      expect(result.content).toContain('1. class:');
+      expect(result.content).toContain('2. function:');
+      expect(result.content).toContain('3. function:');
       expect(result.tokens).toBeGreaterThan(0);
       // Token footer moved to metadata, no longer in content
       expect(result.content).not.toContain('🪙');
@@ -101,7 +101,7 @@ describe('Formatters', () => {
       const formatter = new CompactFormatter();
       const formatted = formatter.formatResult(minimalResult);
 
-      expect(formatted).toContain('[50%]');
+      expect(formatted).not.toContain('[50%]');
       expect(formatted).not.toContain('undefined');
     });
 
@@ -120,7 +120,7 @@ describe('Formatters', () => {
       const formatter = new VerboseFormatter();
       const formatted = formatter.formatResult(mockResults[0]);
 
-      expect(formatted).toContain('[Score: 89.0%]');
+      expect(formatted).not.toContain('[Score:');
       expect(formatted).toContain('class:');
       expect(formatted).toContain('AuthMiddleware');
       expect(formatted).toContain('Location: src/auth/middleware.ts:15');
@@ -136,9 +136,9 @@ describe('Formatters', () => {
       const formatter = new VerboseFormatter();
       const result = formatter.formatResults(mockResults);
 
-      expect(result.content).toContain('1. [Score: 89.0%]');
-      expect(result.content).toContain('2. [Score: 84.0%]');
-      expect(result.content).toContain('3. [Score: 72.0%]');
+      expect(result.content).toContain('1. class:');
+      expect(result.content).toContain('2. function:');
+      expect(result.content).toContain('3. function:');
 
       // Should have double newlines between results
       expect(result.content).toContain('\n\n');
@@ -201,7 +201,7 @@ describe('Formatters', () => {
       const formatter = new VerboseFormatter();
       const formatted = formatter.formatResult(minimalResult);
 
-      expect(formatted).toContain('[Score: 50.0%]');
+      expect(formatted).not.toContain('[Score:');
       expect(formatted).toContain('TestFunc');
       expect(formatted).not.toContain('undefined');
     });
diff --git a/packages/mcp-server/src/formatters/__tests__/utils.test.ts b/packages/mcp-server/src/formatters/__tests__/utils.test.ts
index 7da44fd..151a77b 100644
--- a/packages/mcp-server/src/formatters/__tests__/utils.test.ts
+++ b/packages/mcp-server/src/formatters/__tests__/utils.test.ts
@@ -176,31 +176,29 @@ describe('Formatter Utils', () => {
 
     it('should estimate within 5% for technical content', () => {
       // Real test case from actual usage (full text)
-      const technicalText = `## GitHub Search Results
-**Query:** "token estimation and cost tracking"
-**Total Found:** 3
+      const technicalText = `Found 3 results for "token estimation and cost tracking" | showing top 3
 
-1. [Score: 29.6%] function: estimateTokensForText
+1. function: estimateTokensForText
   Location: packages/mcp-server/src/formatters/utils.ts:15
   Signature: export function estimateTokensForText(text: string): number
   Metadata: language: typescript, exported: true, lines: 19
 
-2. [Score: 21.0%] function: estimateTokensForJSON
+2. function: estimateTokensForJSON
   Location: packages/mcp-server/src/formatters/utils.ts:63
   Signature: export function estimateTokensForJSON(obj: unknown): number
   Metadata: language: typescript, exported: true, lines: 4
 
-3. [Score: 19.7%] method: VerboseFormatter.estimateTokens
+3. method: VerboseFormatter.estimateTokens
   Location: packages/mcp-server/src/formatters/verbose-formatter.ts:114
   Signature: estimateTokens(result: SearchResult): number
   Metadata: language: typescript, exported: true, lines: 3`;
 
       const estimate = estimateTokensForText(technicalText);
-      const actualTokens = 178; // Verified from Cursor
+      const actualTokens = 155; // Updated for new format without scores
 
-      // Should be within 5% of actual (calibrated at 0.6%)
+      // Should be within 10% of actual
       const errorPercent = Math.abs((estimate - actualTokens) / actualTokens) * 100;
-      expect(errorPercent).toBeLessThan(5);
+      expect(errorPercent).toBeLessThan(10);
     });
   });
 
diff --git a/packages/mcp-server/src/formatters/compact-formatter.ts b/packages/mcp-server/src/formatters/compact-formatter.ts
index 268d921..8872a95 100644
--- a/packages/mcp-server/src/formatters/compact-formatter.ts
+++ b/packages/mcp-server/src/formatters/compact-formatter.ts
@@ -87,8 +87,6 @@ export class CompactFormatter implements ResultFormatter {
   private formatHeader(result: SearchResult): string {
     const parts: string[] = [];
 
-    parts.push(`[${(result.score * 100).toFixed(0)}%]`);
-
     if (this.options.includeTypes && typeof result.metadata.type === 'string') {
       parts.push(`${result.metadata.type}:`);
     }
@@ -152,7 +150,8 @@ export class CompactFormatter implements ResultFormatter {
 
   formatResults(results: SearchResult[]): FormattedResult {
     if (results.length === 0) {
-      const content = 'No results found';
+      const content =
+        'No results found. Try broader terms or use dev_map to explore the codebase structure.';
       return {
         content,
         tokens: estimateTokensForText(content),
diff --git a/packages/mcp-server/src/formatters/verbose-formatter.ts b/packages/mcp-server/src/formatters/verbose-formatter.ts
index fe3c213..3aded43 100644
--- a/packages/mcp-server/src/formatters/verbose-formatter.ts
+++ b/packages/mcp-server/src/formatters/verbose-formatter.ts
@@ -103,8 +103,6 @@ export class VerboseFormatter implements ResultFormatter {
 
   private formatHeader(result: SearchResult): string {
     const header: string[] = [];
-    header.push(`[Score: ${(result.score * 100).toFixed(1)}%]`);
-
     if (this.options.includeTypes && typeof result.metadata.type === 'string') {
       header.push(`${result.metadata.type}:`);
     }
@@ -197,7 +195,8 @@ export class VerboseFormatter implements ResultFormatter {
 
   formatResults(results: SearchResult[]): FormattedResult {
     if (results.length === 0) {
-      const content = 'No results found';
+      const content =
+        'No results found. Try broader terms or use dev_map to explore the codebase structure.';
       return {
         content,
         tokens: estimateTokensForText(content),
diff --git a/packages/mcp-server/src/schemas/__tests__/schemas.test.ts b/packages/mcp-server/src/schemas/__tests__/schemas.test.ts
index 211564f..0d4f4c4 100644
--- a/packages/mcp-server/src/schemas/__tests__/schemas.test.ts
+++ b/packages/mcp-server/src/schemas/__tests__/schemas.test.ts
@@ -98,7 +98,6 @@ describe('SearchArgsSchema', () => {
       expect(result.data).toMatchObject({
         format: 'compact',
         limit: 10,
-        scoreThreshold: 0,
       });
     }
   });
diff --git a/packages/mcp-server/src/schemas/index.ts b/packages/mcp-server/src/schemas/index.ts
index ca5e993..e21560b 100644
--- a/packages/mcp-server/src/schemas/index.ts
+++ b/packages/mcp-server/src/schemas/index.ts
@@ -47,7 +47,6 @@ export const SearchArgsSchema = z
     query: z.string().min(1, 'Query must be a non-empty string'),
     format: FormatSchema.default('compact'),
     limit: z.number().int().min(1).max(50).default(10),
-    scoreThreshold: z.number().min(0).max(1).default(0),
     tokenBudget: z.number().int().min(500).max(10000).optional(),
   })
   .strict();

From fce827961da4475a3385637fe1f87a33c28504fd Mon Sep 17 00:00:00 2001
From: prosdev <prosdevlab@gmail.com>
Date: Wed, 1 Apr 2026 23:16:11 -0700
Subject: [PATCH 2/2] chore: add changeset and release notes for search score
 removal

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 .changeset/drop-search-scores.md  |  5 +++++
 website/content/latest-version.ts |  8 ++++----
 website/content/updates/index.mdx | 14 ++++++++++++++
 3 files changed, 23 insertions(+), 4 deletions(-)
 create mode 100644 .changeset/drop-search-scores.md

diff --git a/.changeset/drop-search-scores.md b/.changeset/drop-search-scores.md
new file mode 100644
index 0000000..81c4e05
--- /dev/null
+++ b/.changeset/drop-search-scores.md
@@ -0,0 +1,5 @@
+---
+"@prosdevlab/dev-agent": patch
+---
+
+Remove misleading similarity scores from MCP search results. Search output now shows ranked results without percentages, matching industry practice (Sourcegraph Cody, Cursor, GitHub Copilot). Also fixes dev_refs failing to find symbols due to SearchService defaulting scoreThreshold to 0.7 which silently filtered all RRF results.
diff --git a/website/content/latest-version.ts b/website/content/latest-version.ts
index 93998ca..c47ba51 100644
--- a/website/content/latest-version.ts
+++ b/website/content/latest-version.ts
@@ -4,10 +4,10 @@
  */
 
 export const latestVersion = {
-  version: '0.12.0',
-  title: 'Go Callees + Rust Language Support',
+  version: '0.12.1',
+  title: 'Cleaner Search Output + refs Fix',
   date: 'April 1, 2026',
   summary:
-    'Index Rust codebases — functions, structs, traits, impl methods, callees. Go call graph tracing. All MCP tools work with both languages.',
-  link: '/updates#v0120--go-callees--rust-language-support',
+    'MCP search results drop misleading scores, add result preamble, and fix dev_refs silently returning no results.',
+  link: '/updates#v0121--cleaner-search-output--refs-fix',
 } as const;
diff --git a/website/content/updates/index.mdx b/website/content/updates/index.mdx
index 42eb60f..36af1f7 100644
--- a/website/content/updates/index.mdx
+++ b/website/content/updates/index.mdx
@@ -9,6 +9,20 @@ What's new in dev-agent. We ship improvements regularly to help AI assistants un
 
 ---
 
+## v0.12.1 — Cleaner Search Output + refs Fix
+
+*April 1, 2026*
+
+**MCP search results now match industry best practices.**
+
+- **Drop misleading scores:** search results no longer show RRF fusion percentages (always ~1-2%). Results are ranked by position, matching Sourcegraph Cody, Cursor, and GitHub Copilot
+- **Result preamble:** search output starts with `Found N results for "query" | showing top K`
+- **Fix dev_refs via MCP:** `SearchService` defaulted `scoreThreshold` to 0.7, silently filtering all results since RRF scores are ~0.01. Now defaults to 0
+- **Remove `scoreThreshold` from MCP tool schema:** agents can no longer pass a threshold that doesn't work with RRF scores. Core API retains it for CLI use
+- **Better empty results:** suggests `dev_map` when no results found
+
+---
+
 ## v0.12.0 — Go Callees + Rust Language Support
 
 *April 1, 2026*