Extraction Sessions API

Overview

The Extraction Sessions API maintains conversation history for Gemini AI during claim extraction. It enables multi-turn context by storing the complete message history between the user (system prompts + transcripts) and the AI model (claim extraction responses). This allows the claim extraction process to maintain context across multiple extraction runs, improving accuracy and consistency. Function Types:

Internal Query: getByDebate
Internal Mutation: upsert

getByDebate

import { internal } from "@/convex/_generated/api";

const session = await ctx.runQuery(internal.extractionSessions.getByDebate, {
  debateId: debateId
});

if (session) {
  // Continue existing conversation
  const history = session.messages;
} else {
  // Start new conversation
  const history = [];
}

Internal query to retrieve the extraction session history for a specific debate.

Parameters

debateId

Id<'debates'>

required

The ID of the debate to retrieve the session for

Returns

session

ExtractionSession | null

The session object containing message history, or null if no session exists yet

Session Object Structure

_id

Id<'extractionSessions'>

Unique session identifier

_creationTime

number

Convex automatic creation timestamp

debateId

Id<'debates'>

ID of the associated debate

messages

Message[]

Array of conversation messages in chronological order

Message Object Structure

role

'user' | 'model'

The role of the message sender:

"user": System prompts and transcript inputs
"model": Gemini AI responses with extracted claims

content

string

The message content (prompt text or AI response)

Behavior

Uses by_debate index for efficient lookup
Returns first (and only) session for the debate
Returns null if no session has been created yet

upsert

import { internal } from "@/convex/_generated/api";

// Get existing session
const session = await ctx.runQuery(internal.extractionSessions.getByDebate, {
  debateId: debateId
});

// Build updated message history
const messages = [
  ...(session?.messages || []),
  {
    role: "user" as const,
    content: "New transcript: Speaker A said..."
  },
  {
    role: "model" as const,
    content: '{"claims": [...]}'
  }
];

// Save updated session
await ctx.runMutation(internal.extractionSessions.upsert, {
  debateId: debateId,
  messages: messages
});

Internal mutation to create or update the extraction session history for a debate.

Parameters

debateId

Id<'debates'>

required

The ID of the debate

messages

Message[]

required

The complete array of messages representing the conversation history

messages[].role

'user' | 'model'

required

The role of each message

messages[].content

string

required

The content of each message

Returns

return

null

Returns null on success

Behavior

Queries for existing session using by_debate index
If session exists:
- Updates the existing session’s messages array via patch
If session doesn’t exist:
- Creates new session with provided messages via insert
Replaces entire message array (not append)

The upsert function replaces the entire message array. To append messages, you must:

Fetch existing session with getByDebate
Concatenate new messages to existing array
Call upsert with complete array

Message Validation Schema

const messageValidator = v.object({
  role: v.union(v.literal("user"), v.literal("model")),
  content: v.string(),
})

Usage Pattern

The typical flow for maintaining extraction context:

Example Flow

First Extraction:

// No session exists yet
const session = await ctx.runQuery(internal.extractionSessions.getByDebate, {
  debateId
}); // Returns null

const messages = [
  { role: "user", content: "Extract claims from: [transcript 1]" },
  { role: "model", content: '{"claims": ["claim 1"]}' }
];

await ctx.runMutation(internal.extractionSessions.upsert, {
  debateId,
  messages
});

Second Extraction (with context):

// Session now exists
const session = await ctx.runQuery(internal.extractionSessions.getByDebate, {
  debateId
});

const messages = [
  ...session.messages, // Previous context
  { role: "user", content: "Extract claims from: [transcript 2]" },
  { role: "model", content: '{"claims": ["claim 2"]}' }
];

await ctx.runMutation(internal.extractionSessions.upsert, {
  debateId,
  messages
});

Benefits of Session History

Contextual Awareness: Gemini can reference previously extracted claims
Consistency: Maintains consistent claim formatting and extraction patterns
Deduplication: AI can avoid extracting duplicate claims
Progressive Refinement: Model learns debate-specific patterns
Multi-turn Reasoning: Enables complex extraction across multiple passes

Database Relationship

One-to-one relationship: Each debate has at most one extraction session
Session persists across multiple extraction runs
Session is never deleted (maintains full history)
Indexed by debateId for efficient lookups

Convex Functions

Schema

Extraction Sessions API

Overview

getByDebate

Parameters

Returns

Session Object Structure

Message Object Structure

Behavior

upsert

Parameters

Returns

Behavior

Message Validation Schema

Usage Pattern

Example Flow

Benefits of Session History

Database Relationship

Build docs developers (and LLMs) love

Convex Functions

Schema

​Overview

​getByDebate

​Parameters

​Returns

​Session Object Structure

​Message Object Structure

​Behavior

​upsert

​Parameters

​Returns

​Behavior

​Message Validation Schema

​Usage Pattern

​Example Flow

​Benefits of Session History

​Database Relationship

Build docs developers (and LLMs) love

Overview

getByDebate

Parameters

Returns

Session Object Structure

Message Object Structure

Behavior

upsert

Parameters

Returns

Behavior

Message Validation Schema

Usage Pattern

Example Flow

Benefits of Session History

Database Relationship