The team continues to refine our core infrastructure and boost performance across Gemma3 / zkML Interface key modules. Here’s a quick look at what’s been built and improved this week.
2/ Gemma3 Performance: Quantized Gemma3 model currently includes nearly 10 000 nodes; kernelized execution shows limited performance due to excessive node granularity.
3/ Gemma3 Refactor: Analyzed model structure and found most nodes are shape-related and redundant—potentially removable. In the ideal case, over 90 % of nodes can be eliminated.
4/ zkML Iface Latency Optimization: Refactored zkmlface codebase, cutting inference latency down to tens of milliseconds. The interface is not yet connected to the TEE environment.
5/ Next Steps: Deploy the optimized zkmlface on a GPU TEE-enabled machine once available. Compile the pruned Gemma3 graph into high-efficiency GPU kernels for integration testing. Stay tuned for more updates
3,03 тыс.
19
Содержание этой страницы предоставляется третьими сторонами. OKX не является автором цитируемых статей и не имеет на них авторских прав, если не указано иное. Материалы предоставляются исключительно в информационных целях и не отражают мнения OKX. Материалы не являются инвестиционным советом и призывом к покупке или продаже цифровых активов. Раздел использует ИИ для создания обзоров и кратких содержаний предоставленных материалов. Обратите внимание, что информация, сгенерированная ИИ, может быть неточной и непоследовательной. Для получения полной информации изучите соответствующую оригинальную статью. OKX не несет ответственности за материалы, содержащиеся на сторонних сайтах. Цифровые активы, в том числе стейблкоины и NFT, подвержены высокому риску, а их стоимость может сильно колебаться. Перед торговлей и покупкой цифровых активов оцените ваше финансовое состояние и принимайте только взвешенные решения.