newAPI的模型计费有两种模式,一种是按次计费的,一种是按token数目来计费的。我这一篇文章主要讲解的是按照token数目计费的方案。
按次计费,在系统中叫做模型固定价格,即调用一次这个模型,无论输出多少字,都往用户的账上扣这一定数目的。
按token计费的,则会分为两个维度来计费,一个是输入,另一个是输出(模型称之为补全),系统的分词模型使用的是openai的tokenizer来对输出进行分词。
而newapi设置模型价格的方案是倍率设置,不是默认的直接设置多少元每100万字这种方案。newapi有一个基准价格(这个价格为2刀每100万token),如果需要调整一个模型的输入价格,那么这个模型倍率*这个基准价格就是这个模型的价格了。
打个比方,一个模型的模型倍率为2,那么在newapi中,该模型每输入100万字,消费4刀(2刀*2)
上面是模型的输入价格,还有一个输出价格。newapi中有一个参数是补全倍率(其实就是输出倍率),含义是每100万字输出价格是每100万字输入的多少倍。
再次打个比方,如果一个模型的模型倍率是3,补全倍率是2,那么这个模型的价格是:6刀/100万token输入 12刀一百万token输出