当前位置: 首页 > news >正文

数据结构与算法--1.判断数组中元素是否有重复

在C语言中,我们可以使用类似的方法来实现判断数组中是否有重复值的功能。由于C语言没有内置的哈希集合(如Python的set或C++的unordered_set),我们需要自己实现一个简单的哈希表或使用其他方法。

方法一:暴力法(双重循环)
时间复杂度:O(n²)
空间复杂度:O(1)

#include <stdbool.h>bool containsDuplicate(int* nums, int numsSize) {for (int i = 0; i < numsSize; i++) {for (int j = i + 1; j < numsSize; j++) {if (nums[i] == nums[j]) {return true;}}}return false;
}

说明:

使用双重循环比较每一对元素。

如果发现相同的元素,立即返回true。

遍历结束后仍未发现重复,返回false。

方法二:先排序后比较相邻元素
时间复杂度:O(n log n)(取决于排序算法)
空间复杂度:O(1)(如果原地排序)

#include <stdbool.h>
#include <stdlib.h>// 比较函数,用于qsort
int compare(const void* a, const void* b) {return (*(int*)a - *(int*)b);
}bool containsDuplicate(int* nums, int numsSize) {qsort(nums, numsSize, sizeof(int), compare); // 使用标准库的快速排序for (int i = 0; i < numsSize - 1; i++) {if (nums[i] == nums[i + 1]) {return true;}}return false;
}

说明:

使用qsort对数组进行排序(时间复杂度一般为O(n log n))。

遍历排序后的数组,检查相邻元素是否相同。

如果发现相同,返回true;否则返回false。

方法三:简单哈希表(适用于元素范围较小的情况)
时间复杂度:O(n)
空间复杂度:O(k)(k为元素的范围)

如果已知数组元素的范围较小(例如0 <= nums[i] <= 1000),可以用数组模拟哈希表:

#include <stdbool.h>
#include <string.h>bool containsDuplicate(int* nums, int numsSize) {// 假设元素范围为 0~1000bool seen[1001] = {false}; // 初始化所有值为falsefor (int i = 0; i < numsSize; i++) {if (seen[nums[i]]) {return true;}seen[nums[i]] = true;}return false;
}

说明:

初始化一个布尔数组seen,用于记录元素是否出现过。

遍历数组,如果seen[nums[i]]为true,说明重复,返回true。

否则,标记seen[nums[i]] = true。

遍历结束后返回false。

方法四:通用哈希表(适用于任意整数)
如果元素范围很大或未知,可以手动实现一个简单的哈希表(例如使用开放寻址法或链地址法)。以下是开放寻址法的简单实现:

#include <stdbool.h>
#include <stdlib.h>#define TABLE_SIZE 10000typedef struct {int key;bool used;
} HashEntry;HashEntry hashTable[TABLE_SIZE];// 哈希函数(简单取模)
int hash(int key) {return abs(key) % TABLE_SIZE;
}bool containsDuplicate(int* nums, int numsSize) {memset(hashTable, 0, sizeof(hashTable)); // 初始化哈希表for (int i = 0; i < numsSize; i++) {int h = hash(nums[i]);while (hashTable[h].used) {if (hashTable[h].key == nums[i]) {return true;}h = (h + 1) % TABLE_SIZE; // 线性探测}hashTable[h].key = nums[i];hashTable[h].used = true;}return false;
}

说明:

定义一个哈希表hashTable,每个槽位存储一个键和是否使用的标志。

使用取模哈希函数计算位置。

如果发生冲突,使用线性探测(h = (h + 1) % TABLE_SIZE)寻找下一个空槽。

如果找到相同的键,返回true;否则插入键并标记为已使用。

遍历结束后返回false。

方法选择建议
小规模数据:暴力法(方法一)简单直接。

中等规模数据:排序法(方法二)更高效。

元素范围较小:数组哈希表(方法三)最快。

通用情况:手动实现哈希表(方法四),但代码较复杂。

完整测试代码

#include <stdio.h>
#include <stdbool.h>
#include <stdlib.h>
#include <string.h>// 方法一:暴力法
bool containsDuplicate_bruteForce(int* nums, int numsSize) {for (int i = 0; i < numsSize; i++) {for (int j = i + 1; j < numsSize; j++) {if (nums[i] == nums[j]) {return true;}}}return false;
}// 方法二:排序法
int compare(const void* a, const void* b) {return (*(int*)a - *(int*)b);
}bool containsDuplicate_sort(int* nums, int numsSize) {qsort(nums, numsSize, sizeof(int), compare);for (int i = 0; i < numsSize - 1; i++) {if (nums[i] == nums[i + 1]) {return true;}}return false;
}// 方法三:数组哈希表(假设元素范围0~1000)
bool containsDuplicate_arrayHash(int* nums, int numsSize) {bool seen[1001] = {false};for (int i = 0; i < numsSize; i++) {if (seen[nums[i]]) {return true;}seen[nums[i]] = true;}return false;
}// 方法四:通用哈希表
#define TABLE_SIZE 10000
typedef struct {int key;bool used;
} HashEntry;HashEntry hashTable[TABLE_SIZE];int hash(int key) {return abs(key) % TABLE_SIZE;
}bool containsDuplicate_hashTable(int* nums, int numsSize) {memset(hashTable, 0, sizeof(hashTable));for (int i = 0; i < numsSize; i++) {int h = hash(nums[i]);while (hashTable[h].used) {if (hashTable[h].key == nums[i]) {return true;}h = (h + 1) % TABLE_SIZE;}hashTable[h].key = nums[i];hashTable[h].used = true;}return false;
}int main() {int nums1[] = {1, 2, 3, 1};int nums2[] = {1, 2, 3, 4};int nums3[] = {1, 1, 1, 1};printf("Brute Force:\n");printf("%d\n", containsDuplicate_bruteForce(nums1, 4)); // 1 (true)printf("%d\n", containsDuplicate_bruteForce(nums2, 4)); // 0 (false)printf("Sort:\n");printf("%d\n", containsDuplicate_sort(nums1, 4)); // 1printf("%d\n", containsDuplicate_sort(nums2, 4)); // 0printf("Array Hash:\n");printf("%d\n", containsDuplicate_arrayHash(nums1, 4)); // 1printf("%d\n", containsDuplicate_arrayHash(nums2, 4)); // 0printf("Hash Table:\n");printf("%d\n", containsDuplicate_hashTable(nums1, 4)); // 1printf("%d\n", containsDuplicate_hashTable(nums2, 4)); // 0return 0;
}

输出

Brute Force:
1
0
Sort:
1
0
Array Hash:
1
0
Hash Table:
1
0

总结
暴力法:代码简单,但效率低。

排序法:时间O(n log n),空间O(1)或O(n)。

数组哈希表:时间O(n),空间O(k)(需已知元素范围)。

通用哈希表:时间O(n),空间O(m)(需处理冲突)。

相关文章:

  • 量子机器学习在工业领域的首破:药物研发中的分子活性预测革命
  • HTML应用指南:利用POST请求获取全国小菜园门店位置信息
  • 机器学习赋能的多尺度材料模拟与催化设计前沿技术
  • Ubuntu2404装机指南
  • Ubuntu 常用命令行指令
  • 编译器习惯 【idea】
  • 安全用电基础知识及隐患排查重点
  • IntelliJ IDEA 中最常用的快捷键分类整理
  • 制作一款打飞机游戏教程5:添加子弹
  • vLLM:高性能大语言模型推理引擎详解与对比分析
  • Linux(9)Apache
  • HDFS Full Block Report超限导致性能下降的原因分析
  • 类头文件相互包含的问题
  • Python-8: 找出整型数组中占比超过一半的数
  • 医疗领域的利器:深入理解3D Slicer软件
  • Go:使用共享变量实现并发
  • 多种方案对比实现 Kaggle 比赛介绍进行行业分类
  • 线代第二章矩阵第一课:矩阵的概念
  • 数据一致性的守护神:深入Spring声明式事务管理 (@Transactional)
  • Redis适用场景
  • 上海发布一组人事任免信息:钱晓、翁轶丛任市数据局副局长
  • 商务部就海外社交平台上发布从所谓中国“代工厂”低价购买国际知名品牌事答问
  • 调查丨当节气出现“时差”,陕西的果农们经历着什么?
  • 拖车10公里收1900元?货车司机质疑收费过高,潮州饶平县市监局已介入
  • 马上评丨从东方红一号到神二十,中国航天步履不停
  • 国防部:“台独”武装摆练纯属搞心理安慰,怎么演都是溃败的死局