nlweb-ai
diff --git a/‎.gitignore‎
Lines changed: 13 additions & 1 deletion b/‎.gitignore‎
Lines changed: 13 additions & 1 deletion
diff --git a/‎AskAgent/python/core/baseHandler.py‎
Lines changed: 5 additions & 2 deletions b/‎AskAgent/python/core/baseHandler.py‎
Lines changed: 5 additions & 2 deletions
diff --git a/‎AskAgent/python/core/config.py‎
Lines changed: 7 additions & 2 deletions b/‎AskAgent/python/core/config.py‎
Lines changed: 7 additions & 2 deletions
diff --git a/‎AskAgent/python/core/ranking.py‎
Lines changed: 128 additions & 12 deletions b/‎AskAgent/python/core/ranking.py‎
Lines changed: 128 additions & 12 deletions
@@ -13,6 +13,13 @@ myenv
 venv
 .env
 data/
+!NLWebScorer/data/
+NLWebScorer/data/*.json
+NLWebScorer/data/*.jsonl
+NLWebScorer/data/**/*.json
+NLWebScorer/data/**/*.jsonl
+NLWebScorer/data/prepared*/
+NLWebScorer/data/holdout*/
 
 
 # User-specific files (MonoDevelop/Xamarin Studio)
@@ -458,4 +465,9 @@ static/.DS_Store
 nlwm_deploy_*.zip
 agentfinder_deploy_*.zip
 
-openai-apps-sdk-examples/
+openai-apps-sdk-examples/
+
+# NLWebScorer - exclude checkpoints and training logs
+NLWebScorer/checkpoints/
+NLWebScorer/*.log
+AskAgent/set_keys.sh
@@ -115,6 +115,9 @@ def __init__(self, query_params, http_handler):
         # Maximum number of results to return to the user
         self.max_results = get_param(query_params, "max_results", int, 10)
 
+        # Protocol version (v0.55 when using structured POST body)
+        self.protocol_version = query_params.get('_protocol_version')
+
         # the items that have been retrieved from the vector database, could be before decontextualization.
         # See below notes on fasttrack
         self.retrieved_items = []
@@ -413,8 +416,8 @@ async def prepare(self):
                 )
                 self.final_retrieved_items = items
                 self.retrieval_done_event.set()
-        
-        logger.info("Preparation phase completed")
+
+        logger.info(f"Preparation phase completed. Retrieved {len(self.final_retrieved_items)} items.")
 
     def decontextualizeQuery(self):
         if (len(self.prev_queries) < 1):
 
@@ -102,6 +102,7 @@ class NLWebConfig:
     who_endpoint_enabled: bool = True  # Enable or disable the who endpoint
     api_keys: Dict[str, str] = field(default_factory=dict)  # API keys for external services
     who_endpoint: str = "http://localhost:8000/who"  # Endpoint for /who requests
+    scoring: Dict[str, Any] = field(default_factory=dict)  # Scoring configuration (e.g. nlwebscorer)
 
 @dataclass
 class ConversationStorageConfig:
@@ -487,7 +488,10 @@ def load_nlweb_config(self, path: str = "config_nlweb.yaml"):
 
         # Load who_endpoint from config
         who_endpoint = self._get_config_value(data.get("who_endpoint"), "http://localhost:8000/who")
-        
+
+        # Load scoring configuration
+        scoring = data.get("scoring", {})
+
         # Load headers from config
         headers = data.get("headers", {})
 
@@ -525,7 +529,8 @@ def load_nlweb_config(self, path: str = "config_nlweb.yaml"):
             aggregation_enabled=aggregation_enabled,
             who_endpoint_enabled=who_endpoint_enabled,
             api_keys=api_keys,
-            who_endpoint=who_endpoint
+            who_endpoint=who_endpoint,
+            scoring=scoring
         )
 
     def get_chatbot_instructions(self, instruction_type: str = "search_results") -> str:
 
@@ -19,6 +19,66 @@
 from core.utils.utils import record_llm_call
 logger = get_configured_logger("ranking_engine")
 
+# Lazy-loaded NLWebScorer singleton
+_nlweb_scorer = None
+_nlweb_scorer_is_available = None  # Cached availability check
+
+def _nlweb_scorer_available():
+    """Check if NLWebScorer checkpoints exist and config is enabled (cached)."""
+    global _nlweb_scorer_is_available
+    if _nlweb_scorer_is_available is not None:
+        return _nlweb_scorer_is_available
+    from core.config import CONFIG
+    scorer_config = CONFIG.nlweb.scoring.get("nlwebscorer", {})
+    if not scorer_config.get("enabled"):
+        _nlweb_scorer_is_available = False
+        return False
+    import os
+    nlweb_root = os.path.dirname(os.path.dirname(os.path.dirname(
+        os.path.dirname(os.path.abspath(__file__)))))
+    bert_path = scorer_config.get("bert_checkpoint")
+    gam_path = scorer_config.get("gam_checkpoint")
+    if not bert_path or not gam_path:
+        logger.warning("NLWebScorer enabled but checkpoint paths not configured, using LLM scorer")
+        _nlweb_scorer_is_available = False
+        return False
+    bert_cp = os.path.join(nlweb_root, bert_path)
+    gam_cp = os.path.join(nlweb_root, gam_path)
+    _nlweb_scorer_is_available = os.path.exists(bert_cp) and os.path.exists(gam_cp)
+    if _nlweb_scorer_is_available:
+        logger.info("NLWebScorer checkpoints found, will use as default scorer")
+    else:
+        logger.info("NLWebScorer checkpoints not found, using LLM scorer")
+    return _nlweb_scorer_is_available
+
+def _get_nlweb_scorer():
+    """Get or create the NLWebScorer instance (lazy-loaded on first use)."""
+    global _nlweb_scorer
+    if _nlweb_scorer is None:
+        from core.config import CONFIG
+        scorer_config = CONFIG.nlweb.scoring.get("nlwebscorer", {})
+
+        import os, sys
+        # Resolve NLWeb root: ranking.py -> core -> python -> code -> AskAgent -> NLWeb
+        nlweb_root = os.path.dirname(os.path.dirname(os.path.dirname(
+            os.path.dirname(os.path.abspath(__file__)))))
+        bert_cp = os.path.join(nlweb_root, scorer_config.get("bert_checkpoint", ""))
+        gam_cp = os.path.join(nlweb_root, scorer_config.get("gam_checkpoint", ""))
+
+        scorer_dir = os.path.join(nlweb_root, "NLWebScorer")
+        if scorer_dir not in sys.path:
+            sys.path.append(scorer_dir)  # append, not insert — NLWebScorer/config/ would shadow app's config
+        from inference.scorer import NLWebScorer
+
+        logger.info(f"Loading NLWebScorer: bert={bert_cp}, gam={gam_cp}")
+        _nlweb_scorer = NLWebScorer(
+            bert_checkpoint=bert_cp,
+            gam_checkpoint=gam_cp,
+            max_length=scorer_config.get("max_length", 1024),
+        )
+        logger.info("NLWebScorer loaded successfully")
+    return _nlweb_scorer
+
 
 class Ranking:
 
@@ -197,10 +257,50 @@ async def rankItem(self, url, json_str, name, site):
 
         except Exception as e:
             # Import here to avoid circular import
-            from config.config import CONFIG
+            from core.config import CONFIG
             if CONFIG.should_raise_exceptions():
                 raise  # Re-raise in testing/development mode
 
+    async def rankItemsWithScorer(self):
+        """Batch-score all items using NLWebScorer (no LLM calls)."""
+        scorer = _get_nlweb_scorer()
+        query = self.handler.decontextualized_query or self.handler.query
+
+        # Build items for scorer — full schema, let BERT handle semantics
+        scorer_items = []
+        for url, json_str, name, site in self.items:
+            schema_json = json.dumps(json_str) if isinstance(json_str, dict) else json_str
+            scorer_items.append({"name": name, "schema_json": schema_json})
+
+        results = await asyncio.to_thread(scorer.score, query, scorer_items)
+
+        logger.debug(f"NLWebScorer results for: '{query}' ({len(results)} items)")
+        debug_rows = []
+        for i, (url, json_str, name, site) in enumerate(self.items):
+            score = results[i]["score"]
+            schema_object = json_str if isinstance(json_str, dict) else json.loads(json_str)
+            if isinstance(schema_object, list) and len(schema_object) > 0:
+                schema_object = schema_object[0]
+
+            desc = name
+            if isinstance(schema_object, dict):
+                desc = schema_object.get("description", schema_object.get("name", name))
+                if isinstance(desc, str) and len(desc) > 200:
+                    desc = desc[:200] + "..."
+
+            ansr = {
+                'url': url, 'site': site, 'name': name,
+                'ranking': {"score": score, "description": desc},
+                'schema_object': schema_object, 'sent': False
+            }
+            self.rankedAnswers.append(ansr)
+            debug_rows.append((score, name))
+
+        debug_rows.sort(key=lambda x: x[0], reverse=True)
+        for score, name in debug_rows:
+            logger.debug(f"  {score:3d} - {name[:70]}")
+        logger.debug("=== end scores ===")
+
     def shouldSend(self, result):
         # Get max_results from handler, or use default
         max_results = getattr(self.handler, 'max_results', self.NUM_RESULTS_TO_SEND)
@@ -322,18 +422,34 @@ async def sendMessageOnSitesBeingAsked(self, top_embeddings):
                 self.handler.connection_alive_event.clear()
 
     async def do(self):
-    
-        tasks = []
-        for url, json_str, name, site in self.items:
-            if self.handler.connection_alive_event.is_set():  # Only add new tasks if connection is still alive
-                tasks.append(asyncio.create_task(self.rankItem(url, json_str, name, site)))
-       
-        # await self.sendMessageOnSitesBeingAsked(self.items)
 
-        try:
-            await asyncio.gather(*tasks, return_exceptions=True)
-        except Exception as e:
-            return
+        # Determine scorer: auto-detect NLWebScorer if available, allow override via ?scorer=llm
+        scorer_param = self.handler.query_params.get('scorer', [None])
+        scorer_override = scorer_param[0] if isinstance(scorer_param, list) else scorer_param
+        if scorer_override == "llm":
+            use_nlwebscorer = False
+        elif scorer_override == "nlwebscorer":
+            use_nlwebscorer = True
+        else:
+            # Auto-detect: use NLWebScorer if checkpoints exist
+            use_nlwebscorer = _nlweb_scorer_available()
+
+        if use_nlwebscorer:
+            try:
+                await self.rankItemsWithScorer()
+            except Exception as e:
+                logger.error(f"NLWebScorer scoring failed: {e}", exc_info=True)
+                return
+        else:
+            tasks = []
+            for url, json_str, name, site in self.items:
+                if self.handler.connection_alive_event.is_set():
+                    tasks.append(asyncio.create_task(self.rankItem(url, json_str, name, site)))
+
+            try:
+                await asyncio.gather(*tasks, return_exceptions=True)
+            except Exception as e:
+                return
 
         if not self.handler.connection_alive_event.is_set():
             return