返回首页  设为首页  加入收藏  今天是:
网站首页电脑主板电脑cpu电脑内存电脑硬盘电脑显卡电脑电源显示器电脑配件电脑维修
相关文章
 WhaleStudio 26正式发布Whal…
 颜值实力并存的它原来这么好…
 内存超频能力依旧拔群!微星…
 《最终幻想14:黄金的遗产》…
 暑期游戏本大战开打两家RTX4…
 AI也能提供情绪价值了
 显盈科技:公司主营的信号转…
 一种具有远程传输能力的新型…
 奥海科技取得服务器电源固件…
 浦科特M9PeG 256GB NVMe M2 …
 晶振在固态硬盘SSD中的应用
 燃爆扩展时代 极空间硬盘扩展…
 戴尔售后维修点查询
 戴尔笔记本怎么重装系统
 戴尔电脑开机黑屏怎么办 戴尔…
 美音达音壕耳机酷派5218d 82…
 翔升爵豹8600 OF 256M 128B …
 九州风神AE-AMD卡西摩多简装…
 见证历史A股市值“一哥”换人…
 时隔4年A股市值“一哥”再度…
 机械师夜鹰F117-F6升级版
 贵20倍的专业显示器好在哪儿…
 液晶显示器对比度和亮度多少…
 显示器不可不知的参数!助你…
 华硕B85M-F PLUS 电脑主板
 华硕ROG 战刃2 标准版
 AMD X4 740怎么样?X4 740配…
 英特尔傲腾持久内存 200 系列…
 如何挑选内存
 什么是GDDR7内存——有关即将…
 着眼强劲算力需求英特尔数据…
 硬朗大将在线 SUPER大将评测
 技嘉 GeForce GTX 1660 OC 6…
 电脑电源要更换吗?什么时候…
 电脑电源已接通未充电怎么办…
 转换效率是什么
 老毛桃winpe u盘启动模式是什…
 成者CZUR推出图像处理软件成…
 老毛桃u盘装系统教程
 315在行动惠普电脑大量黑屏 …
 电脑未正确启动怎么办 电脑未…
 电脑开不开机怎么回事
 签约项目总投资1656亿元!成…
 成都老板卖数据线个亿
 铁海联运跑出西部发展新空间
 爱鑫微针对LED会议一体机推出…
 电脑蓝屏自动重启怎么
 电脑的CPU四核和双核有什么区…
 震撼登场!TCL华星先锋屏显点…
 浪漫七夕节 易美逊超薄显示器…
专题栏目
网络
您现在的位置: 电脑评测网 >> 电脑内存 >> 正文
高级搜索
WhaleStudio 26正式发布WhaleTunnel同步性能与连接器数量再创新高!
作者:佚名 文章来源:本站原创 点击数: 更新时间:2024/7/8 22:56:47 | 【字体:

  伏羲八卦次序图在这个数据驱动的大模型时代,数据集成的作用和意义愈发重要。数据不仅仅是信息的载体,更是推动企业决策和创新的关键因素。作为全球最流行的批流一体数据集成工具,WhaleTunnel随着WhaleStudio 2.6版本正式发布,带来了多项功能增强和新特性,性能大幅提升,连接器和功能方面也有大量更新。

  WhaleTunnel是基于白鲸开源主导的Apache SeaTunnel之上精心打磨的商业级的数据集成工具,拥有数据传输速度快、准确率高、稳定性强等技术特点,帮助企业完成内部EtLT中数据集成EtL部分,支持百余种连接器类型,满足用户离线全量同步、离线增量同步、实时增量同步、变化数据捕捉(即CDC)、数据库同步备份等需求。快速产品以代码形式面向数据开发工程师以及任何需要数据集成服务的用户,同时也提供可视化拖拽界面给数据科学家、数据分析师、产品经理等业务用户,支持全流程可视化的任务定义、调用、监控和管理。

  2.6版本新增了多种数据源,数据源支持数量已经达到了188个,部分增加的数据源如下:

  在WhaleTunnel 2.6版本当中,Zeta Engine针对以ARM内核的CPU进行了引擎层面的深度优化,性能提升数倍(相关性能POC报告后续发布)。

  1.内存映射文件和零拷贝技术:为了最大限度地减少I/O开销,Zeta Engine采用了内存映射(mmap)技术和零拷贝(zero-copy)技术,直接在内存中操作文件数据。这样不仅加快了数据处理速度,还降低了系统资源的消耗。

  2.内存对齐:Zeta Engine确保数据结构在内存中的对齐性,有效减少了内存访问的开销。内存对齐优化不仅提高了内存访问的效率,还提升了数据处理的整体性能。

  3.高效算法:Zeta Engine使用了适合ARM架构的高效算法,减少不必要的计算和数据移动。通过高效的排序和过滤算法,显著提升数据转换和处理的效率。Zeta Engine算法优化确保了在数据密集型任务中,系统能够保持卓越的性能。

  4.多核架构利用:Zeta Engine充分利用ARM CPU的多核架构,将ETL任务分解为更小的任务,进行多线程或多进程并行执行。通过并行化处理,显著缩短了数据处理的时间,提升了系统的吞吐量。

  1.自动建表、已有数据处理:除了文件类型的数据源外,所有数据源现支持自动建表。无论是已有表结构还是已有数据处理,WhaleTunnel都能轻松应对。同时,目标端支持自定义表名策略。无需手动处理复杂的表结构,极大地减少了数据集成的时间和人工成本。

  2.数据模型推演:在任务保存时自动触发,自动检查source、transform、sink中的配置是否合法;在任务重同步表发生表结构变化时,检查其变化可能导致的配置项非法问题。确保数据流的稳定性和一致性,减少因配置错误导致的数据同步失败。在运行数据集成任务之前,就可以自动识别潜在的问题并提前修复。

  3.数据类型自动映射:数据源到目标端的数据类型自动映射。自动适配不同的数据类型,减少手动调整的麻烦。从不同数据库迁移数据时,无需担心类型不匹配的问题。

  1.增量同步和参数传递:WhaleTunnel与WhaleScheduler紧密集成,根据调度中的日历、业务日期(牌)以及上下游参数进行增量同步或者参数传递来进行数据内容控制,进一步提高数据同步的灵活性和准确性。例如,在券商监管报表生成时,能够自动获取符合上报规则交易日期的数据,确保数据的准确性。

  2.独立同步调度任务组件:WhaleTunnel拥有独立的CDC实时调度组件和批量调度组件,可以在WhaleScheduler成为独立任务组件被上下游进行触发等工作,实现更灵活的任务调度和管理。在数据集成后,进行相关数据加工,或者自定义微批任务,实现微批任务的串行等待等。

  3.增量数据参数传递:离线全量Source支持根据自定义where条件读取,可以使用调度传递的参数变量实现增量数据参数传递,精准控制数据同步范围,实现增量/批量/微批的多场景控制,提升整体数据批量和CDC实时处理能力。

  1.离线同步新增支持失败、超时告警, 提前预警潜在问题,减少数据同步失败带来的影响。举例来说,在夜间批处理任务中,能够及时发现并处理异常,确保数据同步的顺利进行。

  2.实时同步新增失败告警、实时同步新增DDL变更事件告警:实时监控数据同步状态,快速响应和处理异常情况。例如,电商平台可以及时发现和修正订单数据同步中的问题,确保业务的连续性,可以让用户快速收到DDL变更情况,从而更早的手工干预。

  1.文件数据源:新增支持 CSV文件类型以压缩格式读写,支持读取时跳过表头和写入时写入表头设置,支持新的文件格式:DBF, Debezium-Json, 更灵活地处理不同格式的文件数据,提高数据导入导出的效率。

  2.No-SQL数据源支持:创建虚拟表时支持配置主键,且sink自动建表时使用该主键建表,提高数据一致性和查询效率。例如,在处理NoSQL数据时,可以更好地管理和索引数据。

  4.HTTP数据源虚拟表优化:优化数据源和虚拟表配置,token、路径、请求参数等支持填写参数变量,更灵活地集成和管理HTTP数据源,提高数据获取的灵活性和效率。

  1.唯一索引表同步:CDC同步源表现支持拥有唯一索引的表同步,确保数据的唯一性和完整性。例如,在用户信息同步时,可以确保用户ID的唯一性,避免数据重复和冲突。

  2.无主键表同步:CDC同步源表支持无主键表的同步,提供更广泛的数据同步支持,适应更多样化的数据库设计。例如,在某些历史数据表中,可能没有主键的设计,但仍然可以实现高效的数据同步。

  WhaleTunnel 2.6版本功能非常强大,涵盖了从数据模型设计、自动化建表,到高效的数据同步和监控告警,以及多样化的数据源支持。无论您的数据集成需求是简单的数据传输还是复杂的实时分析,WhaleTunnel都能为您提供定制化的解决方案,帮助您实现数据驱动的业务成功。

  我们期待与您一同迎接数据集成的新时代!如果您对WhaleTunnel 2.6版本有任何疑问或想了解更多信息,请随时联系我们的客户服务团队。感谢您对WhaleTunnel的信任和支持!

  白鲸开源是一家开源原生的DataOps商业公司,是国家高新技术企业,由多个Apache Foundation Member成立,80%员工都是 Apache Committer,运营2个全球Apache开源项目(DolphinScheduler, SeaTunnel)。白鲸开源已根据全球最佳实践发布商业版产品WhaleStudio(含白鲸数据调度平台WhaleScheduler和白鲸数据集成平台WhaleTunnel)。我们致力于打造下一代开源原生的DataOps 平台,助力企业在大数据和云时代,智能化地完成多数据源、多云及信创环境的数据集成、调度开发和治理,以提高企业解决数据问题的效率,提升企业分析洞察能力和决策能力。

  如果您希望深入了解我们的其他功能,或者讨论如何将 WhaleStudio 与你的业务流程相结合,我们非常愿意为你提供帮助。欢迎您首先试用白鲸调度系统(WhaleScheduler),开始您的大数据之旅。

  中国的桥,千姿百态,瑰丽多彩,从古至今如同道道彩虹,横亘华夏大地,创造了灿烂文化与辉煌成就。

  进入夏天,在位于青海省西宁市的西宁熊猫馆,饲养员为馆内的4只大熊猫准备了西瓜、胡萝卜、苹果等食材,丰富食物内容,调整大熊猫的饮食结构。

  近年来,天津持续推进海洋生态保护与修复,并合理利用开发。目前,天津已建成多个亲海主题公园及沙滩景区,为市民和游客提供看海亲海的休闲场所。

  盛夏时节,北京市圆明园遗址公园内二百多个品种的一千余亩荷花盛开,吸引大批游客和市民前来赏荷避暑。

  “我们将及时总结本次演练活动的经验,进一步完善水上应急处置程序,加大水上救助装备建设,不断提升水上救助能力,为地方经济发展和保障民众生命财产安全保驾护航。”李晟表示。

电脑内存录入:admin    责任编辑:admin 
  • 上一个电脑内存:

  • 下一个电脑内存: 没有了
  •  
     栏目文章
    普通电脑内存 WhaleStudio 26正式发布WhaleTunnel同步性能与… (07-08)
    普通电脑内存 颜值实力并存的它原来这么好用英睿达DDR5 Pro… (07-08)
    普通电脑内存 内存超频能力依旧拔群!微星MEG Z490 ACE主板… (07-08)
    普通电脑内存 英特尔傲腾持久内存 200 系列宣布将停产但 20… (07-07)
    普通电脑内存 如何挑选内存 (07-07)
    普通电脑内存 什么是GDDR7内存——有关即将推出的图形VRAM技… (07-07)
    普通电脑内存 绝区零和鸣潮哪个好玩 绝区零为什么叫zzz (07-06)
    普通电脑内存 术语详解:内存类型 (07-06)
    普通电脑内存 73年前香农已经给大模型发展埋下一颗种子 (07-06)
    普通电脑内存 电脑如何扩大虚拟内存 作用是什么 (07-05)
    普通电脑内存 电脑卡是cpu还是内存 (07-05)
    普通电脑内存 物理内存和虚拟内存讲解课 (07-05)
    普通电脑内存 linux内存释放 (07-04)
    普通电脑内存 win10系统内存占用率高怎么办?内存占用高解决… (07-04)
    普通电脑内存 GT-HMI-Engine v130a 发布专为国内嵌入式 UI … (07-04)
    普通电脑内存 笔记本内存条怎么看是DDR几 (07-03)
    普通电脑内存 机构:2024年笔记本电脑内存平均搭载容量将增… (07-03)
    普通电脑内存 怎样扩大电脑内存 电脑扩大内存方法 (07-03)
    普通电脑内存 产品名称} (07-02)
    普通电脑内存 手机内存有什么用 (07-02)